Claude Sonnet 4.6: AI na úrovni Opus za cenu Sonnet
Anthropic vydal Claude Sonnet 4.6 dne 17. února 2026 – přináší výkon blízký modelu Opus za 1/5 ceny. Kompletní přehled novinek, výsledky všech benchmarků, ceny, dostupnost a důvody, proč mu vývojáři dávají přednost v 70 % případů před Sonnet 4.5.
TL;DR
Anthropic vydal Claude Sonnet 4.6 dne 17. února 2026. Hlavní poznatky:
- 79,6 % SWE-bench — téměř identický s Opus 4.6 (80,8 %) při programování v reálném světě
- 72,5 % OSWorld — v podstatě vyrovnaný s Opus 4.6 (72,7 %) v rámci Computer Use, téměř dvojnásobek oproti GPT-5.2 (38,2 %)
- 3 $/15 $ za milion tokenů — beze změny oproti Sonnet 4.5, 5x levnější než Opus
- Kontextové okno 1M tokenů (beta) — navýšeno z 200K
- Nyní jako výchozí model pro všechny uživatele Claude Free a Pro
Co Anthropic oznámil
Claude Sonnet 4.6 je druhým významným modelem, který Anthropic vydal v průběhu necelých dvou týdnů (po Opus 4.6 z 6. února). Ve svém blogovém příspěvku jej Anthropic popisuje jako „kompletní upgrade dovedností modelu v oblastech programování, Computer Use, uvažování v dlouhém kontextu, plánování agentů, znalostní práce a designu“.
Hlavní tvrzení zní: „Výkon, který by dříve vyžadoval sáhnutí po modelu třídy Opus – a to i u reálných, ekonomicky hodnotných kancelářských úkolů – je nyní k dispozici se Sonnet 4.6.“
To je významné prohlášení. Anthropic v podstatě říká: pro většinu produkčních zátěží již nemusíte platit za Opus.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Kompletní rozbor benchmarků
Kde se Sonnet 4.6 vyrovná nebo poráží Opus
| Benchmark | Co testuje | Sonnet 4.6 | Opus 4.6 | GPT-5.2 |
|---|---|---|---|---|
| SWE-bench Verified | Programování v reálném světě | 79,6 % | 80,8 % | 80,0 % |
| OSWorld-Verified | Computer Use | 72,5 % | 72,7 % | 38,2 % |
| GDPval-AA (Elo) | Kancelářské úkoly | 1633 | 1606 | 1462 |
| Finance Agent v1.1 | Finanční analýza | 63,3 % | 60,1 % | 59,0 % |
| OfficeQA | Porozumění dokumentům | Vyrovná se Opus | — | — |
Sonnet 4.6 skutečně vede v kancelářských úlohách a finanční analýze — dvou ekonomicky významných kategoriích.
Kde si Opus 4.6 udržuje náskok
| Benchmark | Co testuje | Opus 4.6 | Sonnet 4.6 | Rozdíl |
|---|---|---|---|---|
| Terminal-Bench 2.0 | Agentní kódování v terminálu | 65,4 % | 59,1 % | 6,3 % |
| BrowseComp | Agentní vyhledávání na webu | 84,0 % | 74,7 % | 9,3 % |
| ARC-AGI-2 | Řešení neotřelých problémů | 68,8 % | 58,3 % | 10,5 % |
| GPQA Diamond | Uvažování na úrovni absolventů VŠ | 91,3 % | 89,9 % | 1,4 % |
| MRCR v2 (8-needle 1M) | Uvažování v dlouhém kontextu | 76,0 % | — | — |
Vzorec je jasný: Opus vítězí v úlohách, které vyžadují nejhlubší a nejinovativnější uvažování – refaktorování celých codebase, vícekrokový výzkum a problémy, které model dosud neviděl. Sonnet vítězí v úlohách náročných na rychlost a připravených pro produkci.
Computer Use: Výrazné zlepšení
Čísla u Computer Use si zaslouží zvláštní pozornost:
| Model | OSWorld skóre | Časová osa |
|---|---|---|
| Sonnet 3.5 (říjen 2024) | 14,9 % | První spuštění |
| Sonnet 4.5 | 61,4 % | +46,5 % |
| Sonnet 4.6 | 72,5 % | +11,1 % |
| Opus 4.6 | 72,7 % | Strop |
| GPT-5.2 | 38,2 % | Pro srovnání |
Během 16 měsíců se Sonnet posunul z 14,9 % na 72,5 % v Computer Use — to je 4,9násobné zlepšení. Jamie Cuffe, CEO společnosti Pace (insurtech firma), uvedl, že Sonnet 4.6 dosáhl v jejich interním benchmarku pro Computer Use 94 %: „Dokáže promýšlet chyby a provádět autokorekci způsobem, který jsme dříve neviděli.“
Co je nového oproti Sonnet 4.5
1. Kontextové okno 1M tokenů (beta)
Kontextové okno se rozšiřuje z 200K na 1 milion tokenů. To znamená, že se do jednoho promptu vejdou celé codebase, rozsáhlé právní dokumenty nebo hodiny historie konverzací.
Nová funkce context compaction (také v betě) automaticky shrnuje starší části konverzace, čímž efektivně dále rozšiřuje použitelný kontext.
2. Lepší dodržování pokynů, méně halucinací
Toho si vývojáři všimli nejdříve. Při testování Claude Code:
- 70 % preferovalo Sonnet 4.6 před Sonnet 4.5
- 59 % mu dalo přednost dokonce i před Opus 4.5 (frontier model z listopadu 2025)
- Před úpravou kódu si přečte stávající kód (namísto hádání)
- Konsoliduje logiku namísto její duplikace
- Méně falešných tvrzení o úspěchu („Opravil jsem chybu“, i když se tak nestalo)
- Méně over-engineeringu — nepřidává zbytečné abstrakce
- Lepší dotažení úkolů u vícekrokových zadání
3. Computer Use je připraven pro produkci
Skok z 61,4 % na 72,5 % v OSWorld překonává určitý práh. Uživatelé popisují „schopnosti na lidské úrovni v úlohách, jako je navigace v komplexních tabulkách nebo vyplňování vícekrokových webových formulářů“.
Sonnet 4.6 se také výrazně zlepšil v odolnosti proti prompt injection pro Computer Use — nyní dosahuje úrovně Opus 4.6. To je kritické pro jakéhokoli agenta, který prochází web nebo zpracovává nedůvěryhodné vstupy.
4. Extended Thinking + Adaptive Thinking
Obě funkce jsou podporovány, což modelu umožňuje vyhradit více výpočetního výkonu pro těžší problémy. Je však pozoruhodné, že Sonnet 4.6 podává silný výkon i bez zapnutého Extended Thinking — základní model je fundamentálně lepší.
5. Upgrade bezplatné verze
Uživatelé bezplatné verze Claude nyní dostávají Sonnet 4.6 jako výchozí, a navíc:
- Možnost vytváření souborů
- Connectors (integrace s externími daty)
- Skills (znovupoužitelné instrukce)
- Context compaction
Jedná se o nejschopnější bezplatnou úroveň AI dostupnou od jakéhokoli majoritního poskytovatele.
6. MCP Connectors v Excelu
Claude v Excelu nyní podporuje konektory pro S&P Global, LSEG, Daloopa, PitchBook, Moody's a FactSet — čímž čerpá živá finanční data přímo do tabulek.
Ceny
Cena zůstává stejná jako u Sonnet 4.5:
| Plán | Cena |
|---|---|
| claude.ai Free | 0 $ (Sonnet 4.6 výchozí, limity využití) |
| claude.ai Pro | 20 $/měsíc (vyšší limity, přístup k Opus) |
| API vstup | 3 $ za milion tokenů |
| API výstup | 15 $ za milion tokenů |
Pro srovnání:
- Opus 4.6 API: 15 $/75 $ za milion tokenů (5x více)
- GPT-5.2 API: 5 $/15 $ za milion tokenů (1,7x více za vstup)
- Gemini 3 Pro API: 7 $/21 $ za milion tokenů (2.3x více za vstup)
Náklady na jednu relaci v Claude Code
Pro typickou programátorskou relaci (100K vstupních + 20K výstupních tokenů):
| Model | Cena za relaci |
|---|---|
| Sonnet 4.6 | 0,60 $ |
| GPT-5.2 | 0,80 $ |
| Opus 4.6 | 3,00 $ |
Tým, který spustí 100 agentních relací denně, ušetří ~240 $/den díky použití Sonnet 4.6 namísto Opus.
Jak získat přístup
claude.ai
Již nyní je výchozím modelem. Otevřete claude.ai → používáte Sonnet 4.6.Claude Code
claude # Sonnet 4.6 je nyní výchozí
claude --model claude-sonnet-4-6-20250217 # explicitní výběr
API
Model ID:claude-sonnet-4-6-20250217
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6-20250217",
max_tokens=4096,
messages=[{"role": "user", "content": "Your prompt here"}]
)
Cloudové platformy
Dostupné na Amazon Bedrock a Google Cloud Vertex AI od prvního dne.Kontext v rámci odvětví
Sonnet 4.6 je druhým významným vydáním Anthropicu během 11 dnů (po Opus 4.6 z 6. února). CNBC popsala toto tempo jako „pokračující závratnou rychlost vydávání AI modelů“. VentureBeat jej označil za „seismickou událost v přecenění pro AI průmysl“.
Širší trend: laťka výkonu se zvyšuje. To, co před šesti měsíci vyžadovalo vlajkový model za 15 $/75 $, je nyní k dispozici za 3 $/15 $. Pro tvůrce AI produktů to znamená:
- Provoz AI funkcí stojí 5x méně
- Agenti využívající Computer Use jsou ekonomicky životaschopní ve velkém měřítku
- Model již není úzkým hrdlem — tím je samotné nasazení
Budujete s Claude Sonnet 4.6? Y Build se integruje s Claude Code pro vývoj s podporou AI, a následně řeší nasazení, produktová videa Demo Cut, AI SEO a analytiku — kompletní stack od kódu po růst. Začněte zdarma.
Zdroje:
- Anthropic: Introducing Claude Sonnet 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship at one-fifth the cost
- 9to5Mac: Claude Sonnet 4.6 improved coding skills
- MacRumors: Claude Sonnet 4.6 improved coding, computer use
- MarkTechPost: Claude 4.6 Sonnet with 1M token context
- OfficeChai: Claude Sonnet 4.6 Benchmarks
- SiliconANGLE: Anthropic debuts Sonnet 4.6
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.