Claude Sonnet 4.6: AI på Opus-nivå till Sonnet-pris

TL;DR

Anthropic släppte Claude Sonnet 4.6 den 17 februari 2026. Det viktigaste att ta med sig:

79,6 % SWE-bench — nästan identiskt med Opus 4.6 (80,8 %) på verklig kodning
72,5 % OSWorld — i princip dött lopp med Opus 4.6 (72,7 %) på datoranvändning, nästan dubbelt så bra som GPT-5.2 (38,2 %)
$3/$15 per miljon tokens — oförändrat från Sonnet 4.5, 5x billigare än Opus
1 miljon tokens kontextfönster (beta) — upp från 200K
Nu standardmodellen för alla Free- och Pro-användare av Claude

Utvecklare föredrog Sonnet 4.6 framför Sonnet 4.5 70 % av gångerna i Claude Code, och föredrog den till och med framför Opus 4.5 59 % av gångerna.

Vad Anthropic tillkännagav

Claude Sonnet 4.6 är Anthropics andra stora modellsläpp på under två veckor (efter Opus 4.6 den 6 februari). I sitt blogginlägg beskriver Anthropic det som "en fullständig uppgradering av modellens färdigheter inom kodning, datoranvändning, resonemang med lång kontext, agentplanering, kunskapsarbete och design."

Kärnpåståendet: "Prestanda som tidigare skulle ha krävt en modell i Opus-klass — inklusive för verkliga, ekonomiskt värdefulla kontorsuppgifter — är nu tillgänglig med Sonnet 4.6."

Detta är ett betydande uttalande. Anthropic säger i praktiken: för de flesta produktionsmiljöer behöver du inte längre betala för Opus.

Fullständig genomgång av benchmarks

Där Sonnet 4.6 matchar eller slår Opus

Benchmark	Vad det testar	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	Verklig kodning	79,6 %	80,8 %	80,0 %
OSWorld-Verified	Datoranvändning (computer use)	72,5 %	72,7 %	38,2 %
GDPval-AA (Elo)	Kontorsuppgifter	1633	1606	1462
Finance Agent v1.1	Finansiell analys	63,3 %	60,1 %	59,0 %
OfficeQA	Dokumentförståelse	Matchar Opus	—	—

Sonnet 4.6 leder faktiskt inom kontorsuppgifter och finansiell analys — två ekonomiskt betydelsefulla kategorier.

Där Opus 4.6 behåller ledningen

Benchmark	Vad det testar	Opus 4.6	Sonnet 4.6	Skillnad
Terminal-Bench 2.0	Agent-baserad terminalkodning	65,4 %	59,1 %	6,3 %
BrowseComp	Agent-baserad webbsökning	84,0 %	74,7 %	9,3 %
ARC-AGI-2	Ny problemlösning	68,8 %	58,3 %	10,5 %
GPQA Diamond	Resonemang på doktorandnivå	91,3 %	89,9 %	1,4 %
MRCR v2 (8-needle 1M)	Resonemang med lång kontext	76,0 %	—	—

Mönstret är tydligt: Opus vinner på uppgifter som kräver det djupaste, mest originella resonemanget — refaktorering av hela kodbaser, forskning i flera steg och problem som modellen aldrig sett tidigare. Sonnet vinner på hastighetskänsliga, produktionsredo uppgifter.

Computer Use: Den mest framstående förbättringen

Siffrorna för datoranvändning (computer use) förtjänar extra uppmärksamhet:

Modell	OSWorld-poäng	Tidslinje
Sonnet 3.5 (okt 2024)	14,9 %	Första lanseringen
Sonnet 4.5	61,4 %	+46,5 %
Sonnet 4.6	72,5 %	+11,1 %
Opus 4.6	72,7 %	Taket
GPT-5.2	38,2 %	För jämförelse

På 16 månader gick Sonnet från 14,9 % till 72,5 % på datoranvändning — en 4,9x förbättring. Jamie Cuffe, VD för Pace (ett försäkringsteknikföretag), rapporterade att Sonnet 4.6 nådde 94 % på deras interna benchmark för datoranvändning: "Den resonerar sig igenom misslyckanden och självkorrigerar på ett sätt som vi inte har sett tidigare."

Vad som är nytt jämfört med Sonnet 4.5

1. 1M token kontextfönster (Beta)

Kontextfönstret utökas från 200K till 1 miljon tokens. Detta innebär att hela kodbaser, omfattande juridiska dokument eller timmar av konversationshistorik får plats i en enda prompt.

En ny funktion för kontextkomprimering (också i beta) sammanfattar automatiskt äldre delar av konversationen, vilket i praktiken förlänger den användbara kontexten ännu mer.

2. Bättre instruktionsföljsamhet, färre hallucinationer

Detta var vad utvecklare märkte först. Vid testning i Claude Code:

70 % föredrog Sonnet 4.6 framför Sonnet 4.5
59 % föredrog den till och med framför Opus 4.5 (frontier-modellen från november 2025)

Specifika förbättringar som nämns:

Läser befintlig kod innan den modifierar den (istället för att gissa)
Konsoliderar logik istället för att duplicera den
Färre falska påståenden om framgång ("Jag har fixat buggen" när den inte har det)
Mindre överdesign — lägger inte till onödiga abstraktioner
Bättre genomförande av uppgifter i flera steg

Cursors medgrundare kallade det "en märkbar förbättring jämfört med Sonnet 4.5 över hela linjen, inklusive långsiktiga uppgifter och svårare problem." GitHub rapporterade "starka lösningsgrader och den typ av konsekvens som utvecklare behöver" vid komplexa fixar över flera kodbaser.

3. Computer Use blir redo för produktion

Hoppet från 61,4 % till 72,5 % på OSWorld passerar en tröskel. Användare beskriver "förmåga på mänsklig nivå i uppgifter som att navigera i komplexa kalkylblad eller fylla i webbformulär i flera steg."

Sonnet 4.6 har också förbättrats avsevärt vad gäller resistens mot prompt-injection för datoranvändning — och presterar nu på samma nivå som Opus 4.6. Detta är avgörande för alla agenter som surfar på webben eller bearbetar otillförlitlig input.

4. Extended Thinking + Adaptive Thinking

Båda stöds, vilket låter modellen allokera mer beräkningskraft till svårare problem. Men värt att notera är att Sonnet 4.6 presterar starkt även utan extended thinking aktiverat — basmodellen är fundamentalt bättre.

5. Uppgradering av gratisnivån

Gratisanvändare av Claude får nu Sonnet 4.6 som standard, plus:

Möjlighet att skapa filer

Connectors (integrationer med externa data)

Skills (återanvändbara instruktioner)

Kontextkomprimering

Detta är den mest kapabla gratisnivån för AI som finns tillgänglig från någon större leverantör.

6. MCP-kopplingar i Excel

Claude i Excel stöder nu kopplingar för S&P Global, LSEG, Daloopa, PitchBook, Moody's och FactSet — vilket gör det möjligt att hämta live-finansdata direkt till kalkylblad.

Prissättning

Ingen prisförändring från Sonnet 4.5:

Plan	Pris
claude.ai Free	$0 (Sonnet 4.6 standard, användningsgränser)
claude.ai Pro	$20/mån (högre gränser, tillgång till Opus)
API input	$3 per miljon tokens
API output	$15 per miljon tokens

Som jämförelse:

Opus 4.6 API: $15/$75 per miljon tokens (5x mer)

GPT-5.2 API: $5/$15 per miljon tokens (1,7x dyrare input)

Gemini 3 Pro API: $7/$21 per miljon tokens (2,3x dyrare input)

Kostnad per Claude Code-session

För en typisk kodningssession (100K input + 20K output tokens):

Modell	Kostnad per session
Sonnet 4.6	$0,60
GPT-5.2	$0,80
Opus 4.6	$3,00

Ett team som kör 100 agentsessioner per dag sparar cirka $240 per dag genom att använda Sonnet 4.6 istället för Opus.

Hur man får tillgång

claude.ai

Redan standard. Öppna claude.ai → du använder Sonnet 4.6.

Claude Code

bash

claude  # Sonnet 4.6 är nu standard
claude --model claude-sonnet-4-6-20250217  # explicit val

API

Modell-ID: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Molnplattformar

Tillgänglig på Amazon Bedrock och Google Cloud Vertex AI från dag ett.

Branschkontext

Sonnet 4.6 är Anthropics andra stora släpp på 11 dagar (efter Opus 4.6 den 6 februari). CNBC beskrev takten som "en fortsatt rasande hastighet för släpp av AI-modeller." VentureBeat kallade det "en seismisk händelse för prissättningen inom AI-branschen."

Den bredare trenden: prestandagolvet höjs. Det som krävde en flaggskeppsmodell för $15/$75 för sex månader sedan levereras nu för $3/$15. För de som bygger AI-produkter innebär detta:

AI-funktioner kostar 5x mindre att köra
Agenter för datoranvändning är ekonomiskt hållbara i stor skala
Modellen är inte längre flaskhalsen — leveransen är det

Bygger du med Claude Sonnet 4.6? Y Build integrerar med Claude Code för AI-assisterad utveckling och hanterar sedan driftsättning, Demo Cut-produktvideor, AI SEO och analys — hela stacken från kod till tillväxt. Starta gratis.

Källor: