Claude Sonnet 4.6: AI på Opus-nivå till Sonnet-pris
Anthropic släppte Claude Sonnet 4.6 den 17 februari 2026 – med prestanda nära Opus till 1/5 av kostnaden. Komplett genomgång av nyheterna, alla benchmark-poäng, prissättning, tillgänglighet och varför utvecklare föredrar den 70 % framför Sonnet 4.5.
TL;DR
Anthropic släppte Claude Sonnet 4.6 den 17 februari 2026. Det viktigaste att ta med sig:
- 79,6 % SWE-bench — nästan identiskt med Opus 4.6 (80,8 %) på verklig kodning
- 72,5 % OSWorld — i princip dött lopp med Opus 4.6 (72,7 %) på datoranvändning, nästan dubbelt så bra som GPT-5.2 (38,2 %)
- $3/$15 per miljon tokens — oförändrat från Sonnet 4.5, 5x billigare än Opus
- 1 miljon tokens kontextfönster (beta) — upp från 200K
- Nu standardmodellen för alla Free- och Pro-användare av Claude
Vad Anthropic tillkännagav
Claude Sonnet 4.6 är Anthropics andra stora modellsläpp på under två veckor (efter Opus 4.6 den 6 februari). I sitt blogginlägg beskriver Anthropic det som "en fullständig uppgradering av modellens färdigheter inom kodning, datoranvändning, resonemang med lång kontext, agentplanering, kunskapsarbete och design."
Kärnpåståendet: "Prestanda som tidigare skulle ha krävt en modell i Opus-klass — inklusive för verkliga, ekonomiskt värdefulla kontorsuppgifter — är nu tillgänglig med Sonnet 4.6."
Detta är ett betydande uttalande. Anthropic säger i praktiken: för de flesta produktionsmiljöer behöver du inte längre betala för Opus.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Fullständig genomgång av benchmarks
Där Sonnet 4.6 matchar eller slår Opus
| Benchmark | Vad det testar | Sonnet 4.6 | Opus 4.6 | GPT-5.2 |
|---|---|---|---|---|
| SWE-bench Verified | Verklig kodning | 79,6 % | 80,8 % | 80,0 % |
| OSWorld-Verified | Datoranvändning (computer use) | 72,5 % | 72,7 % | 38,2 % |
| GDPval-AA (Elo) | Kontorsuppgifter | 1633 | 1606 | 1462 |
| Finance Agent v1.1 | Finansiell analys | 63,3 % | 60,1 % | 59,0 % |
| OfficeQA | Dokumentförståelse | Matchar Opus | — | — |
Sonnet 4.6 leder faktiskt inom kontorsuppgifter och finansiell analys — två ekonomiskt betydelsefulla kategorier.
Där Opus 4.6 behåller ledningen
| Benchmark | Vad det testar | Opus 4.6 | Sonnet 4.6 | Skillnad |
|---|---|---|---|---|
| Terminal-Bench 2.0 | Agent-baserad terminalkodning | 65,4 % | 59,1 % | 6,3 % |
| BrowseComp | Agent-baserad webbsökning | 84,0 % | 74,7 % | 9,3 % |
| ARC-AGI-2 | Ny problemlösning | 68,8 % | 58,3 % | 10,5 % |
| GPQA Diamond | Resonemang på doktorandnivå | 91,3 % | 89,9 % | 1,4 % |
| MRCR v2 (8-needle 1M) | Resonemang med lång kontext | 76,0 % | — | — |
Mönstret är tydligt: Opus vinner på uppgifter som kräver det djupaste, mest originella resonemanget — refaktorering av hela kodbaser, forskning i flera steg och problem som modellen aldrig sett tidigare. Sonnet vinner på hastighetskänsliga, produktionsredo uppgifter.
Computer Use: Den mest framstående förbättringen
Siffrorna för datoranvändning (computer use) förtjänar extra uppmärksamhet:
| Modell | OSWorld-poäng | Tidslinje |
|---|---|---|
| Sonnet 3.5 (okt 2024) | 14,9 % | Första lanseringen |
| Sonnet 4.5 | 61,4 % | +46,5 % |
| Sonnet 4.6 | 72,5 % | +11,1 % |
| Opus 4.6 | 72,7 % | Taket |
| GPT-5.2 | 38,2 % | För jämförelse |
På 16 månader gick Sonnet från 14,9 % till 72,5 % på datoranvändning — en 4,9x förbättring. Jamie Cuffe, VD för Pace (ett försäkringsteknikföretag), rapporterade att Sonnet 4.6 nådde 94 % på deras interna benchmark för datoranvändning: "Den resonerar sig igenom misslyckanden och självkorrigerar på ett sätt som vi inte har sett tidigare."
Vad som är nytt jämfört med Sonnet 4.5
1. 1M token kontextfönster (Beta)
Kontextfönstret utökas från 200K till 1 miljon tokens. Detta innebär att hela kodbaser, omfattande juridiska dokument eller timmar av konversationshistorik får plats i en enda prompt.
En ny funktion för kontextkomprimering (också i beta) sammanfattar automatiskt äldre delar av konversationen, vilket i praktiken förlänger den användbara kontexten ännu mer.
2. Bättre instruktionsföljsamhet, färre hallucinationer
Detta var vad utvecklare märkte först. Vid testning i Claude Code:
- 70 % föredrog Sonnet 4.6 framför Sonnet 4.5
- 59 % föredrog den till och med framför Opus 4.5 (frontier-modellen från november 2025)
- Läser befintlig kod innan den modifierar den (istället för att gissa)
- Konsoliderar logik istället för att duplicera den
- Färre falska påståenden om framgång ("Jag har fixat buggen" när den inte har det)
- Mindre överdesign — lägger inte till onödiga abstraktioner
- Bättre genomförande av uppgifter i flera steg
3. Computer Use blir redo för produktion
Hoppet från 61,4 % till 72,5 % på OSWorld passerar en tröskel. Användare beskriver "förmåga på mänsklig nivå i uppgifter som att navigera i komplexa kalkylblad eller fylla i webbformulär i flera steg."
Sonnet 4.6 har också förbättrats avsevärt vad gäller resistens mot prompt-injection för datoranvändning — och presterar nu på samma nivå som Opus 4.6. Detta är avgörande för alla agenter som surfar på webben eller bearbetar otillförlitlig input.
4. Extended Thinking + Adaptive Thinking
Båda stöds, vilket låter modellen allokera mer beräkningskraft till svårare problem. Men värt att notera är att Sonnet 4.6 presterar starkt även utan extended thinking aktiverat — basmodellen är fundamentalt bättre.
5. Uppgradering av gratisnivån
Gratisanvändare av Claude får nu Sonnet 4.6 som standard, plus:
- Möjlighet att skapa filer
- Connectors (integrationer med externa data)
- Skills (återanvändbara instruktioner)
- Kontextkomprimering
Detta är den mest kapabla gratisnivån för AI som finns tillgänglig från någon större leverantör.
6. MCP-kopplingar i Excel
Claude i Excel stöder nu kopplingar för S&P Global, LSEG, Daloopa, PitchBook, Moody's och FactSet — vilket gör det möjligt att hämta live-finansdata direkt till kalkylblad.
Prissättning
Ingen prisförändring från Sonnet 4.5:
| Plan | Pris |
|---|---|
| claude.ai Free | $0 (Sonnet 4.6 standard, användningsgränser) |
| claude.ai Pro | $20/mån (högre gränser, tillgång till Opus) |
| API input | $3 per miljon tokens |
| API output | $15 per miljon tokens |
Som jämförelse:
- Opus 4.6 API: $15/$75 per miljon tokens (5x mer)
- GPT-5.2 API: $5/$15 per miljon tokens (1,7x dyrare input)
- Gemini 3 Pro API: $7/$21 per miljon tokens (2,3x dyrare input)
Kostnad per Claude Code-session
För en typisk kodningssession (100K input + 20K output tokens):
| Modell | Kostnad per session |
|---|---|
| Sonnet 4.6 | $0,60 |
| GPT-5.2 | $0,80 |
| Opus 4.6 | $3,00 |
Ett team som kör 100 agentsessioner per dag sparar cirka $240 per dag genom att använda Sonnet 4.6 istället för Opus.
Hur man får tillgång
claude.ai
Redan standard. Öppna claude.ai → du använder Sonnet 4.6.Claude Code
claude # Sonnet 4.6 är nu standard
claude --model claude-sonnet-4-6-20250217 # explicit val
API
Modell-ID:claude-sonnet-4-6-20250217
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6-20250217",
max_tokens=4096,
messages=[{"role": "user", "content": "Your prompt here"}]
)
Molnplattformar
Tillgänglig på Amazon Bedrock och Google Cloud Vertex AI från dag ett.Branschkontext
Sonnet 4.6 är Anthropics andra stora släpp på 11 dagar (efter Opus 4.6 den 6 februari). CNBC beskrev takten som "en fortsatt rasande hastighet för släpp av AI-modeller." VentureBeat kallade det "en seismisk händelse för prissättningen inom AI-branschen."
Den bredare trenden: prestandagolvet höjs. Det som krävde en flaggskeppsmodell för $15/$75 för sex månader sedan levereras nu för $3/$15. För de som bygger AI-produkter innebär detta:
- AI-funktioner kostar 5x mindre att köra
- Agenter för datoranvändning är ekonomiskt hållbara i stor skala
- Modellen är inte längre flaskhalsen — leveransen är det
Bygger du med Claude Sonnet 4.6? Y Build integrerar med Claude Code för AI-assisterad utveckling och hanterar sedan driftsättning, Demo Cut-produktvideor, AI SEO och analys — hela stacken från kod till tillväxt. Starta gratis.
Källor:
- Anthropic: Introducing Claude Sonnet 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship at one-fifth the cost
- 9to5Mac: Claude Sonnet 4.6 improved coding skills
- MacRumors: Claude Sonnet 4.6 improved coding, computer use
- MarkTechPost: Claude 4.6 Sonnet with 1M token context
- OfficeChai: Claude Sonnet 4.6 Benchmarks
- SiliconANGLE: Anthropic debuts Sonnet 4.6
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.