Claude Sonnet 4.6: AI na úrovni Opus za cenu Sonnet

TL;DR

Anthropic vydal Claude Sonnet 4.6 dne 17. února 2026. Hlavní poznatky:

79,6 % SWE-bench — téměř identický s Opus 4.6 (80,8 %) při programování v reálném světě
72,5 % OSWorld — v podstatě vyrovnaný s Opus 4.6 (72,7 %) v rámci Computer Use, téměř dvojnásobek oproti GPT-5.2 (38,2 %)
3 $/15 $ za milion tokenů — beze změny oproti Sonnet 4.5, 5x levnější než Opus
Kontextové okno 1M tokenů (beta) — navýšeno z 200K
Nyní jako výchozí model pro všechny uživatele Claude Free a Pro

Vývojáři v rámci Claude Code preferovali Sonnet 4.6 před Sonnet 4.5 v 70 % případů a dokonce mu dávali přednost před Opus 4.5 v 59 % případů.

Co Anthropic oznámil

Claude Sonnet 4.6 je druhým významným modelem, který Anthropic vydal v průběhu necelých dvou týdnů (po Opus 4.6 z 6. února). Ve svém blogovém příspěvku jej Anthropic popisuje jako „kompletní upgrade dovedností modelu v oblastech programování, Computer Use, uvažování v dlouhém kontextu, plánování agentů, znalostní práce a designu“.

Hlavní tvrzení zní: „Výkon, který by dříve vyžadoval sáhnutí po modelu třídy Opus – a to i u reálných, ekonomicky hodnotných kancelářských úkolů – je nyní k dispozici se Sonnet 4.6.“

To je významné prohlášení. Anthropic v podstatě říká: pro většinu produkčních zátěží již nemusíte platit za Opus.

Kompletní rozbor benchmarků

Kde se Sonnet 4.6 vyrovná nebo poráží Opus

Benchmark	Co testuje	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	Programování v reálném světě	79,6 %	80,8 %	80,0 %
OSWorld-Verified	Computer Use	72,5 %	72,7 %	38,2 %
GDPval-AA (Elo)	Kancelářské úkoly	1633	1606	1462
Finance Agent v1.1	Finanční analýza	63,3 %	60,1 %	59,0 %
OfficeQA	Porozumění dokumentům	Vyrovná se Opus	—	—

Sonnet 4.6 skutečně vede v kancelářských úlohách a finanční analýze — dvou ekonomicky významných kategoriích.

Kde si Opus 4.6 udržuje náskok

Benchmark	Co testuje	Opus 4.6	Sonnet 4.6	Rozdíl
Terminal-Bench 2.0	Agentní kódování v terminálu	65,4 %	59,1 %	6,3 %
BrowseComp	Agentní vyhledávání na webu	84,0 %	74,7 %	9,3 %
ARC-AGI-2	Řešení neotřelých problémů	68,8 %	58,3 %	10,5 %
GPQA Diamond	Uvažování na úrovni absolventů VŠ	91,3 %	89,9 %	1,4 %
MRCR v2 (8-needle 1M)	Uvažování v dlouhém kontextu	76,0 %	—	—

Vzorec je jasný: Opus vítězí v úlohách, které vyžadují nejhlubší a nejinovativnější uvažování – refaktorování celých codebase, vícekrokový výzkum a problémy, které model dosud neviděl. Sonnet vítězí v úlohách náročných na rychlost a připravených pro produkci.

Computer Use: Výrazné zlepšení

Čísla u Computer Use si zaslouží zvláštní pozornost:

Model	OSWorld skóre	Časová osa
Sonnet 3.5 (říjen 2024)	14,9 %	První spuštění
Sonnet 4.5	61,4 %	+46,5 %
Sonnet 4.6	72,5 %	+11,1 %
Opus 4.6	72,7 %	Strop
GPT-5.2	38,2 %	Pro srovnání

Během 16 měsíců se Sonnet posunul z 14,9 % na 72,5 % v Computer Use — to je 4,9násobné zlepšení. Jamie Cuffe, CEO společnosti Pace (insurtech firma), uvedl, že Sonnet 4.6 dosáhl v jejich interním benchmarku pro Computer Use 94 %: „Dokáže promýšlet chyby a provádět autokorekci způsobem, který jsme dříve neviděli.“

Co je nového oproti Sonnet 4.5

1. Kontextové okno 1M tokenů (beta)

Kontextové okno se rozšiřuje z 200K na 1 milion tokenů. To znamená, že se do jednoho promptu vejdou celé codebase, rozsáhlé právní dokumenty nebo hodiny historie konverzací.

Nová funkce context compaction (také v betě) automaticky shrnuje starší části konverzace, čímž efektivně dále rozšiřuje použitelný kontext.

2. Lepší dodržování pokynů, méně halucinací

Toho si vývojáři všimli nejdříve. Při testování Claude Code:

70 % preferovalo Sonnet 4.6 před Sonnet 4.5
59 % mu dalo přednost dokonce i před Opus 4.5 (frontier model z listopadu 2025)

Konkrétní uváděná zlepšení:

Před úpravou kódu si přečte stávající kód (namísto hádání)
Konsoliduje logiku namísto její duplikace
Méně falešných tvrzení o úspěchu („Opravil jsem chybu“, i když se tak nestalo)
Méně over-engineeringu — nepřidává zbytečné abstrakce
Lepší dotažení úkolů u vícekrokových zadání

Spoluzakladatel Cursoru jej nazval „znatelným zlepšením oproti Sonnet 4.5 ve všech ohledech, včetně dlouhodobých úloh a obtížnějších problémů“. GitHub oznámil „vysokou míru úspěšnosti řešení a konzistenci, kterou vývojáři potřebují“ u komplexních oprav napříč celou codebase.

3. Computer Use je připraven pro produkci

Skok z 61,4 % na 72,5 % v OSWorld překonává určitý práh. Uživatelé popisují „schopnosti na lidské úrovni v úlohách, jako je navigace v komplexních tabulkách nebo vyplňování vícekrokových webových formulářů“.

Sonnet 4.6 se také výrazně zlepšil v odolnosti proti prompt injection pro Computer Use — nyní dosahuje úrovně Opus 4.6. To je kritické pro jakéhokoli agenta, který prochází web nebo zpracovává nedůvěryhodné vstupy.

4. Extended Thinking + Adaptive Thinking

Obě funkce jsou podporovány, což modelu umožňuje vyhradit více výpočetního výkonu pro těžší problémy. Je však pozoruhodné, že Sonnet 4.6 podává silný výkon i bez zapnutého Extended Thinking — základní model je fundamentálně lepší.

5. Upgrade bezplatné verze

Uživatelé bezplatné verze Claude nyní dostávají Sonnet 4.6 jako výchozí, a navíc:

Možnost vytváření souborů

Connectors (integrace s externími daty)

Skills (znovupoužitelné instrukce)

Context compaction

Jedná se o nejschopnější bezplatnou úroveň AI dostupnou od jakéhokoli majoritního poskytovatele.

6. MCP Connectors v Excelu

Claude v Excelu nyní podporuje konektory pro S&P Global, LSEG, Daloopa, PitchBook, Moody's a FactSet — čímž čerpá živá finanční data přímo do tabulek.

Ceny

Cena zůstává stejná jako u Sonnet 4.5:

Plán	Cena
claude.ai Free	0 $ (Sonnet 4.6 výchozí, limity využití)
claude.ai Pro	20 $/měsíc (vyšší limity, přístup k Opus)
API vstup	3 $ za milion tokenů
API výstup	15 $ za milion tokenů

Pro srovnání:

Opus 4.6 API: 15 $/75 $ za milion tokenů (5x více)

GPT-5.2 API: 5 $/15 $ za milion tokenů (1,7x více za vstup)

Gemini 3 Pro API: 7 $/21 $ za milion tokenů (2.3x více za vstup)

Náklady na jednu relaci v Claude Code

Pro typickou programátorskou relaci (100K vstupních + 20K výstupních tokenů):

Model	Cena za relaci
Sonnet 4.6	0,60 $
GPT-5.2	0,80 $
Opus 4.6	3,00 $

Tým, který spustí 100 agentních relací denně, ušetří ~240 $/den díky použití Sonnet 4.6 namísto Opus.

Jak získat přístup

claude.ai

Již nyní je výchozím modelem. Otevřete claude.ai → používáte Sonnet 4.6.

Claude Code

bash

claude  # Sonnet 4.6 je nyní výchozí
claude --model claude-sonnet-4-6-20250217  # explicitní výběr

API

Model ID: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Cloudové platformy

Dostupné na Amazon Bedrock a Google Cloud Vertex AI od prvního dne.

Kontext v rámci odvětví

Sonnet 4.6 je druhým významným vydáním Anthropicu během 11 dnů (po Opus 4.6 z 6. února). CNBC popsala toto tempo jako „pokračující závratnou rychlost vydávání AI modelů“. VentureBeat jej označil za „seismickou událost v přecenění pro AI průmysl“.

Širší trend: laťka výkonu se zvyšuje. To, co před šesti měsíci vyžadovalo vlajkový model za 15 $/75 $, je nyní k dispozici za 3 $/15 $. Pro tvůrce AI produktů to znamená:

Provoz AI funkcí stojí 5x méně
Agenti využívající Computer Use jsou ekonomicky životaschopní ve velkém měřítku
Model již není úzkým hrdlem — tím je samotné nasazení

Budujete s Claude Sonnet 4.6? Y Build se integruje s Claude Code pro vývoj s podporou AI, a následně řeší nasazení, produktová videa Demo Cut, AI SEO a analytiku — kompletní stack od kódu po růst. Začněte zdarma.

Zdroje: