Claude Sonnet 4.6: KI auf Opus-Niveau zum Sonnet-Preis

TL;DR

Anthropic hat Claude Sonnet 4.6 am 17. Februar 2026 veröffentlicht. Die Kernaussagen:

79,6 % SWE-bench — fast identisch mit Opus 4.6 (80,8 %) bei der Programmierung unter Realbedingungen
72,5 % OSWorld — praktisch gleichauf mit Opus 4.6 (72,7 %) bei der Computer-Nutzung (Computer Use), fast doppelt so hoch wie GPT-5.2 (38,2 %)
3 $/15 $ pro Million Tokens — unverändert gegenüber Sonnet 4.5, 5-mal günstiger als Opus
1M Token Kontextfenster (Beta) — erhöht von 200K
Ab sofort das Standardmodell für alle Free- und Pro-Nutzer von Claude

Entwickler bevorzugten Sonnet 4.6 in Claude Code in 70 % der Fälle gegenüber Sonnet 4.5 und sogar in 59 % der Fälle gegenüber Opus 4.5.

Was Anthropic angekündigt hat

Claude Sonnet 4.6 ist die zweite große Modellveröffentlichung von Anthropic innerhalb von weniger als zwei Wochen (nach Opus 4.6 am 6. Februar). In ihrem Blog-Post beschreibt Anthropic es als „ein umfassendes Upgrade der Modellfähigkeiten in den Bereichen Programmierung, Computer-Nutzung, logisches Denken mit langem Kontext, Agenten-Planung, Wissensarbeit und Design.“

Die zentrale Behauptung: „Leistung, für die man bisher ein Modell der Opus-Klasse benötigt hätte – einschließlich wirtschaftlich wertvoller Büroaufgaben in der realen Welt – ist jetzt mit Sonnet 4.6 verfügbar.“

Dies ist eine bedeutende Aussage. Anthropic sagt damit effektiv: Für die meisten Produktions-Workloads müssen Sie nicht mehr für Opus bezahlen.

Vollständige Benchmark-Analyse

Wo Sonnet 4.6 mit Opus gleichzieht oder es übertrifft

Benchmark	Was getestet wird	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	Programmierung unter Realbedingungen	79,6 %	80,8 %	80,0 %
OSWorld-Verified	Computer-Nutzung	72,5 %	72,7 %	38,2 %
GDPval-AA (Elo)	Büroaufgaben	1633	1606	1462
Finance Agent v1.1	Finanzanalyse	63,3 %	60,1 %	59,0 %
OfficeQA	Dokumentenverständnis	Gleichauf mit Opus	—	—

Sonnet 4.6 führt tatsächlich bei Büroaufgaben und Finanzanalysen – zwei wirtschaftlich hochrelevante Kategorien.

Wo Opus 4.6 die Führung behält

Benchmark	Was getestet wird	Opus 4.6	Sonnet 4.6	Abstand
Terminal-Bench 2.0	Agenten-basierte Terminal-Programmierung	65,4 %	59,1 %	6,3 %
BrowseComp	Agenten-basierte Web-Suche	84,0 %	74,7 %	9,3 %
ARC-AGI-2	Neuartige Problemlösung	68,8 %	58,3 %	10,5 %
GPQA Diamond	Logisches Denken auf Hochschulniveau	91,3 %	89,9 %	1,4 %
MRCR v2 (8-needle 1M)	Logisches Denken mit langem Kontext	76,0 %	—	—

Das Muster ist klar: Opus gewinnt bei Aufgaben, die das tiefste und neuartigste logische Denken erfordern – Refactoring auf Codebase-Ebene, mehrstufige Recherche und Probleme, die das Modell noch nie zuvor gesehen hat. Sonnet gewinnt bei zeitkritischen, produktionsreifen Aufgaben.

Computer Use: Die herausragende Verbesserung

Die Zahlen für Computer Use verdienen besondere Aufmerksamkeit:

Modell	OSWorld Score	Zeitplan
Sonnet 3.5 (Okt. 2024)	14,9 %	Erster Launch
Sonnet 4.5	61,4 %	+46,5 %
Sonnet 4.6	72,5 %	+11,1 %
Opus 4.6	72,7 %	Die Obergrenze
GPT-5.2	38,2 %	Zum Vergleich

In 16 Monaten verbesserte sich Sonnet bei Computer Use von 14,9 % auf 72,5 % – eine 4,9-fache Steigerung. Jamie Cuffe, CEO von Pace (einem Versicherungstechnologie-Unternehmen), berichtete, dass Sonnet 4.6 in ihrem internen Computer-Use-Benchmark 94 % erreichte: „Es analysiert Fehler und korrigiert sich selbst in einer Weise, die wir bisher nicht gesehen haben.“

Was ist neu im Vergleich zu Sonnet 4.5

1. 1M Token Kontextfenster (Beta)

Das Kontextfenster wird von 200.000 auf 1 Million Tokens erweitert. Das bedeutet, dass ganze Codebases, umfangreiche juristische Dokumente oder stundenlange Konversationsverläufe in einen einzigen Prompt passen.

Eine neue Funktion zur Kontext-Kompaktierung (ebenfalls in der Beta) fasst ältere Gesprächsabschnitte automatisch zusammen, wodurch der nutzbare Kontext effektiv noch weiter vergrößert wird.

2. Besseres Befolgen von Anweisungen, weniger Halluzinationen

Dies ist das Erste, was Entwickler bemerkt haben. Bei Tests mit Claude Code:

70 % bevorzugten Sonnet 4.6 gegenüber Sonnet 4.5
59 % bevorzugten es sogar gegenüber Opus 4.5 (dem Frontier-Modell vom November 2025)

Konkret genannte Verbesserungen:

Liest vorhandenen Code, bevor er ihn ändert (anstatt zu raten)
Konsolidiert Logik, anstatt sie zu duplizieren
Weniger falsche Erfolgsmeldungen („Ich habe den Bug behoben“, wenn dies nicht der Fall ist)
Weniger Over-Engineering – fügt keine unnötigen Abstraktionen hinzu
Bessere Umsetzung mehrstufiger Aufgaben

Der Mitbegründer von Cursor nannte es „eine bemerkenswerte Verbesserung gegenüber Sonnet 4.5 in allen Bereichen, einschließlich Aufgaben mit langem Zeithorizont und schwierigeren Problemen.“ GitHub berichtete von „starken Lösungsraten und der Art von Konsistenz, die Entwickler benötigen“ bei komplexen, Codebase-übergreifenden Fixes.

3. Computer Use wird produktionsreif

Der Sprung von 61,4 % auf 72,5 % bei OSWorld überschreitet eine Schwelle. Nutzer beschreiben „Fähigkeiten auf menschlichem Niveau bei Aufgaben wie der Navigation in komplexen Tabellenkalkulationen oder dem Ausfüllen mehrstufiger Webformulare.“

Sonnet 4.6 hat sich auch bei der Resistenz gegen Prompt Injection für Computer Use deutlich verbessert und agiert nun auf dem Niveau von Opus 4.6. Dies ist entscheidend für jeden Agenten, der im Web surft oder nicht vertrauenswürdige Eingaben verarbeitet.

4. Extended Thinking + Adaptive Thinking

Beide Funktionen werden unterstützt, sodass das Modell bei schwierigeren Problemen mehr Rechenleistung zuweisen kann. Bemerkenswert ist jedoch, dass Sonnet 4.6 auch ohne aktiviertes Extended Thinking eine starke Leistung erbringt – das Basismodell ist fundamental besser.

5. Upgrade für die kostenlose Version

Nutzer der kostenlosen Claude-Version erhalten nun standardmäßig Sonnet 4.6, plus:

Funktionen zur Dateierstellung

Connectors (Integrationen mit externen Daten)

Skills (wiederverwendbare Anweisungen)

Kontext-Kompaktierung

Dies ist das leistungsfähigste kostenlose KI-Angebot eines großen Anbieters.

6. MCP Connectors in Excel

Claude in Excel unterstützt jetzt Connectors für S&P Global, LSEG, Daloopa, PitchBook, Moody's und FactSet – und zieht Live-Finanzdaten direkt in Tabellenkalkulationen.

Preise

Keine Preisänderung gegenüber Sonnet 4.5:

Plan	Preis
claude.ai Free	0 $ (Sonnet 4.6 Standard, Nutzungslimits)
claude.ai Pro	20 $/Mo (höhere Limits, Opus-Zugang)
API Input	3 $ pro Million Tokens
API Output	15 $ pro Million Tokens

Zum Vergleich:

Opus 4.6 API: 15 $/75 $ pro Million Tokens (5-mal teurer)

GPT-5.2 API: 5 $/15 $ pro Million Tokens (1,7-mal teurer beim Input)

Gemini 3 Pro API: 7 $/21 $ pro Million Tokens (2,3-mal teurer beim Input)

Kosten pro Claude-Code-Sitzung

Für eine typische Programmiersitzung (100K Input + 20K Output Tokens):

Modell	Kosten pro Sitzung
Sonnet 4.6	0,60 $
GPT-5.2	0,80 $
Opus 4.6	3,00 $

Ein Team, das 100 Agenten-Sitzungen pro Tag durchführt, spart ca. 240 $/Tag durch die Nutzung von Sonnet 4.6 anstelle von Opus.

Zugang erhalten

claude.ai

Bereits standardmäßig eingestellt. Öffnen Sie claude.ai → Sie verwenden Sonnet 4.6.

Claude Code

bash

claude  # Sonnet 4.6 ist jetzt der Standard
claude --model claude-sonnet-4-6-20250217  # Explizite Auswahl

API

Modell-ID: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Cloud-Plattformen

Verfügbar auf Amazon Bedrock und Google Cloud Vertex AI vom ersten Tag an.

Branchenkontext

Sonnet 4.6 ist die zweite große Veröffentlichung von Anthropic innerhalb von 11 Tagen (nach Opus 4.6 am 6. Februar). CNBC beschrieb das Tempo als „Fortsetzung der rasanten Geschwindigkeit bei der Veröffentlichung von KI-Modellen.“ VentureBeat nannte es „ein seismisches Ereignis bei der Preisgestaltung für die KI-Branche.“

Der übergeordnete Trend: Die Leistungsgrenze nach unten steigt. Was vor sechs Monaten ein Flaggschiffmodell für 15 $/75 $ erforderte, wird jetzt für 3 $/15 $ geliefert. Für Entwickler von KI-Produkten bedeutet das:

Der Betrieb von KI-Funktionen kostet 5-mal weniger
Agenten für Computer Use sind in großem Maßstab wirtschaftlich rentabel
Das Modell ist nicht länger der Flaschenhals – die Umsetzung zählt

Entwickeln Sie mit Claude Sonnet 4.6? Y Build integriert sich in Claude Code für KI-unterstützte Entwicklung und kümmert sich dann um Deployment, Demo-Cut-Produktvideos, KI-SEO und Analytics – der Full-Stack vom Code bis zum Wachstum. Kostenlos starten.

Quellen: