Claude Sonnet 4.6: KI auf Opus-Niveau zum Sonnet-Preis
Anthropic hat Claude Sonnet 4.6 am 17. Februar 2026 veröffentlicht – mit einer Leistung fast auf Opus-Niveau zu einem Fünftel der Kosten. Vollständige Analyse der Neuerungen, aller Benchmark-Ergebnisse, Preise, Verfügbarkeit und warum Entwickler es zu 70 % gegenüber Sonnet 4.5 bevorzugen.
TL;DR
Anthropic hat Claude Sonnet 4.6 am 17. Februar 2026 veröffentlicht. Die Kernaussagen:
- 79,6 % SWE-bench — fast identisch mit Opus 4.6 (80,8 %) bei der Programmierung unter Realbedingungen
- 72,5 % OSWorld — praktisch gleichauf mit Opus 4.6 (72,7 %) bei der Computer-Nutzung (Computer Use), fast doppelt so hoch wie GPT-5.2 (38,2 %)
- 3 $/15 $ pro Million Tokens — unverändert gegenüber Sonnet 4.5, 5-mal günstiger als Opus
- 1M Token Kontextfenster (Beta) — erhöht von 200K
- Ab sofort das Standardmodell für alle Free- und Pro-Nutzer von Claude
Was Anthropic angekündigt hat
Claude Sonnet 4.6 ist die zweite große Modellveröffentlichung von Anthropic innerhalb von weniger als zwei Wochen (nach Opus 4.6 am 6. Februar). In ihrem Blog-Post beschreibt Anthropic es als „ein umfassendes Upgrade der Modellfähigkeiten in den Bereichen Programmierung, Computer-Nutzung, logisches Denken mit langem Kontext, Agenten-Planung, Wissensarbeit und Design.“
Die zentrale Behauptung: „Leistung, für die man bisher ein Modell der Opus-Klasse benötigt hätte – einschließlich wirtschaftlich wertvoller Büroaufgaben in der realen Welt – ist jetzt mit Sonnet 4.6 verfügbar.“
Dies ist eine bedeutende Aussage. Anthropic sagt damit effektiv: Für die meisten Produktions-Workloads müssen Sie nicht mehr für Opus bezahlen.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Vollständige Benchmark-Analyse
Wo Sonnet 4.6 mit Opus gleichzieht oder es übertrifft
| Benchmark | Was getestet wird | Sonnet 4.6 | Opus 4.6 | GPT-5.2 |
|---|---|---|---|---|
| SWE-bench Verified | Programmierung unter Realbedingungen | 79,6 % | 80,8 % | 80,0 % |
| OSWorld-Verified | Computer-Nutzung | 72,5 % | 72,7 % | 38,2 % |
| GDPval-AA (Elo) | Büroaufgaben | 1633 | 1606 | 1462 |
| Finance Agent v1.1 | Finanzanalyse | 63,3 % | 60,1 % | 59,0 % |
| OfficeQA | Dokumentenverständnis | Gleichauf mit Opus | — | — |
Sonnet 4.6 führt tatsächlich bei Büroaufgaben und Finanzanalysen – zwei wirtschaftlich hochrelevante Kategorien.
Wo Opus 4.6 die Führung behält
| Benchmark | Was getestet wird | Opus 4.6 | Sonnet 4.6 | Abstand |
|---|---|---|---|---|
| Terminal-Bench 2.0 | Agenten-basierte Terminal-Programmierung | 65,4 % | 59,1 % | 6,3 % |
| BrowseComp | Agenten-basierte Web-Suche | 84,0 % | 74,7 % | 9,3 % |
| ARC-AGI-2 | Neuartige Problemlösung | 68,8 % | 58,3 % | 10,5 % |
| GPQA Diamond | Logisches Denken auf Hochschulniveau | 91,3 % | 89,9 % | 1,4 % |
| MRCR v2 (8-needle 1M) | Logisches Denken mit langem Kontext | 76,0 % | — | — |
Das Muster ist klar: Opus gewinnt bei Aufgaben, die das tiefste und neuartigste logische Denken erfordern – Refactoring auf Codebase-Ebene, mehrstufige Recherche und Probleme, die das Modell noch nie zuvor gesehen hat. Sonnet gewinnt bei zeitkritischen, produktionsreifen Aufgaben.
Computer Use: Die herausragende Verbesserung
Die Zahlen für Computer Use verdienen besondere Aufmerksamkeit:
| Modell | OSWorld Score | Zeitplan |
|---|---|---|
| Sonnet 3.5 (Okt. 2024) | 14,9 % | Erster Launch |
| Sonnet 4.5 | 61,4 % | +46,5 % |
| Sonnet 4.6 | 72,5 % | +11,1 % |
| Opus 4.6 | 72,7 % | Die Obergrenze |
| GPT-5.2 | 38,2 % | Zum Vergleich |
In 16 Monaten verbesserte sich Sonnet bei Computer Use von 14,9 % auf 72,5 % – eine 4,9-fache Steigerung. Jamie Cuffe, CEO von Pace (einem Versicherungstechnologie-Unternehmen), berichtete, dass Sonnet 4.6 in ihrem internen Computer-Use-Benchmark 94 % erreichte: „Es analysiert Fehler und korrigiert sich selbst in einer Weise, die wir bisher nicht gesehen haben.“
Was ist neu im Vergleich zu Sonnet 4.5
1. 1M Token Kontextfenster (Beta)
Das Kontextfenster wird von 200.000 auf 1 Million Tokens erweitert. Das bedeutet, dass ganze Codebases, umfangreiche juristische Dokumente oder stundenlange Konversationsverläufe in einen einzigen Prompt passen.
Eine neue Funktion zur Kontext-Kompaktierung (ebenfalls in der Beta) fasst ältere Gesprächsabschnitte automatisch zusammen, wodurch der nutzbare Kontext effektiv noch weiter vergrößert wird.
2. Besseres Befolgen von Anweisungen, weniger Halluzinationen
Dies ist das Erste, was Entwickler bemerkt haben. Bei Tests mit Claude Code:
- 70 % bevorzugten Sonnet 4.6 gegenüber Sonnet 4.5
- 59 % bevorzugten es sogar gegenüber Opus 4.5 (dem Frontier-Modell vom November 2025)
- Liest vorhandenen Code, bevor er ihn ändert (anstatt zu raten)
- Konsolidiert Logik, anstatt sie zu duplizieren
- Weniger falsche Erfolgsmeldungen („Ich habe den Bug behoben“, wenn dies nicht der Fall ist)
- Weniger Over-Engineering – fügt keine unnötigen Abstraktionen hinzu
- Bessere Umsetzung mehrstufiger Aufgaben
3. Computer Use wird produktionsreif
Der Sprung von 61,4 % auf 72,5 % bei OSWorld überschreitet eine Schwelle. Nutzer beschreiben „Fähigkeiten auf menschlichem Niveau bei Aufgaben wie der Navigation in komplexen Tabellenkalkulationen oder dem Ausfüllen mehrstufiger Webformulare.“
Sonnet 4.6 hat sich auch bei der Resistenz gegen Prompt Injection für Computer Use deutlich verbessert und agiert nun auf dem Niveau von Opus 4.6. Dies ist entscheidend für jeden Agenten, der im Web surft oder nicht vertrauenswürdige Eingaben verarbeitet.
4. Extended Thinking + Adaptive Thinking
Beide Funktionen werden unterstützt, sodass das Modell bei schwierigeren Problemen mehr Rechenleistung zuweisen kann. Bemerkenswert ist jedoch, dass Sonnet 4.6 auch ohne aktiviertes Extended Thinking eine starke Leistung erbringt – das Basismodell ist fundamental besser.
5. Upgrade für die kostenlose Version
Nutzer der kostenlosen Claude-Version erhalten nun standardmäßig Sonnet 4.6, plus:
- Funktionen zur Dateierstellung
- Connectors (Integrationen mit externen Daten)
- Skills (wiederverwendbare Anweisungen)
- Kontext-Kompaktierung
Dies ist das leistungsfähigste kostenlose KI-Angebot eines großen Anbieters.
6. MCP Connectors in Excel
Claude in Excel unterstützt jetzt Connectors für S&P Global, LSEG, Daloopa, PitchBook, Moody's und FactSet – und zieht Live-Finanzdaten direkt in Tabellenkalkulationen.
Preise
Keine Preisänderung gegenüber Sonnet 4.5:
| Plan | Preis |
|---|---|
| claude.ai Free | 0 $ (Sonnet 4.6 Standard, Nutzungslimits) |
| claude.ai Pro | 20 $/Mo (höhere Limits, Opus-Zugang) |
| API Input | 3 $ pro Million Tokens |
| API Output | 15 $ pro Million Tokens |
Zum Vergleich:
- Opus 4.6 API: 15 $/75 $ pro Million Tokens (5-mal teurer)
- GPT-5.2 API: 5 $/15 $ pro Million Tokens (1,7-mal teurer beim Input)
- Gemini 3 Pro API: 7 $/21 $ pro Million Tokens (2,3-mal teurer beim Input)
Kosten pro Claude-Code-Sitzung
Für eine typische Programmiersitzung (100K Input + 20K Output Tokens):
| Modell | Kosten pro Sitzung |
|---|---|
| Sonnet 4.6 | 0,60 $ |
| GPT-5.2 | 0,80 $ |
| Opus 4.6 | 3,00 $ |
Ein Team, das 100 Agenten-Sitzungen pro Tag durchführt, spart ca. 240 $/Tag durch die Nutzung von Sonnet 4.6 anstelle von Opus.
Zugang erhalten
claude.ai
Bereits standardmäßig eingestellt. Öffnen Sie claude.ai → Sie verwenden Sonnet 4.6.Claude Code
claude # Sonnet 4.6 ist jetzt der Standard
claude --model claude-sonnet-4-6-20250217 # Explizite Auswahl
API
Modell-ID:claude-sonnet-4-6-20250217
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6-20250217",
max_tokens=4096,
messages=[{"role": "user", "content": "Your prompt here"}]
)
Cloud-Plattformen
Verfügbar auf Amazon Bedrock und Google Cloud Vertex AI vom ersten Tag an.Branchenkontext
Sonnet 4.6 ist die zweite große Veröffentlichung von Anthropic innerhalb von 11 Tagen (nach Opus 4.6 am 6. Februar). CNBC beschrieb das Tempo als „Fortsetzung der rasanten Geschwindigkeit bei der Veröffentlichung von KI-Modellen.“ VentureBeat nannte es „ein seismisches Ereignis bei der Preisgestaltung für die KI-Branche.“
Der übergeordnete Trend: Die Leistungsgrenze nach unten steigt. Was vor sechs Monaten ein Flaggschiffmodell für 15 $/75 $ erforderte, wird jetzt für 3 $/15 $ geliefert. Für Entwickler von KI-Produkten bedeutet das:
- Der Betrieb von KI-Funktionen kostet 5-mal weniger
- Agenten für Computer Use sind in großem Maßstab wirtschaftlich rentabel
- Das Modell ist nicht länger der Flaschenhals – die Umsetzung zählt
Entwickeln Sie mit Claude Sonnet 4.6? Y Build integriert sich in Claude Code für KI-unterstützte Entwicklung und kümmert sich dann um Deployment, Demo-Cut-Produktvideos, KI-SEO und Analytics – der Full-Stack vom Code bis zum Wachstum. Kostenlos starten.
Quellen:
- Anthropic: Introducing Claude Sonnet 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship at one-fifth the cost
- 9to5Mac: Claude Sonnet 4.6 improved coding skills
- MacRumors: Claude Sonnet 4.6 improved coding, computer use
- MarkTechPost: Claude 4.6 Sonnet with 1M token context
- OfficeChai: Claude Sonnet 4.6 Benchmarks
- SiliconANGLE: Anthropic debuts Sonnet 4.6
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.