Claude Sonnet 4.6: AI på Opus-niveau til Sonnet-pris
Anthropic udgav Claude Sonnet 4.6 den 17. februar 2026 — leverer næsten Opus-ydeevne til 1/5 af prisen. Komplet gennemgang af nyheder, alle benchmark-resultater, priser, tilgængelighed, og hvorfor udviklere foretrækker den 70 % over Sonnet 4.5.
TL;DR
Anthropic udgav Claude Sonnet 4.6 den 17. februar 2026. Det vigtigste at tage med:
- 79,6 % SWE-bench — næsten identisk med Opus 4.6 (80,8 %) til kodning i den virkelige verden
- 72,5 % OSWorld — i praksis det samme som Opus 4.6 (72,7 %) til computerbrug, næsten det dobbelte af GPT-5.2 (38,2 %)
- $3/$15 pr. million tokens — uændret fra Sonnet 4.5, 5x billigere end Opus
- 1M token kontekstvindue (beta) — opgraderet fra 200K
- Nu standardmodellen for alle gratis og Pro Claude-brugere
Hvad Anthropic annoncerede
Claude Sonnet 4.6 er Anthropic's anden store modeludgivelse på under to uger (efter Opus 4.6 den 6. februar). I deres blogindlæg beskriver Anthropic den som "en fuld opgradering af modellens færdigheder inden for kodning, computerbrug, ræsonnement med lang kontekst, agent-planlægning, vidensarbejde og design."
Kernebudskabet: "Ydeevne, som tidligere ville have krævet en model i Opus-klassen — herunder på økonomisk værdifulde kontoropgaver i den virkelige verden — er nu tilgængelig med Sonnet 4.6."
Dette er en markant udmelding. Anthropic siger reelt: For de fleste produktionsopgaver behøver du ikke længere betale for Opus.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Komplet gennemgang af benchmarks
Her matcher eller slår Sonnet 4.6 Opus
| Benchmark | Hvad den tester | Sonnet 4.6 | Opus 4.6 | GPT-5.2 |
|---|---|---|---|---|
| SWE-bench Verified | Kodning i den virkelige verden | 79,6 % | 80,8 % | 80,0 % |
| OSWorld-Verified | Computerbrug | 72,5 % | 72,7 % | 38,2 % |
| GDPval-AA (Elo) | Kontoropgaver | 1633 | 1606 | 1462 |
| Finance Agent v1.1 | Finansiel analyse | 63,3 % | 60,1 % | 59,0 % |
| OfficeQA | Dokumentforståelse | Matcher Opus | — | — |
Sonnet 4.6 fører faktisk på kontoropgaver og finansiel analyse — to økonomisk betydningsfulde kategorier.
Her bevarer Opus 4.6 føringen
| Benchmark | Hvad den tester | Opus 4.6 | Sonnet 4.6 | Forskel |
|---|---|---|---|---|
| Terminal-Bench 2.0 | Agent-baseret terminal-kodning | 65,4 % | 59,1 % | 6,3 % |
| BrowseComp | Agent-baseret websøgning | 84,0 % | 74,7 % | 9,3 % |
| ARC-AGI-2 | Nyskabende problemløsning | 68,8 % | 58,3 % | 10,5 % |
| GPQA Diamond | Ræsonnement på kandidatniveau | 91,3 % | 89,9 % | 1,4 % |
| MRCR v2 (8-needle 1M) | Ræsonnement med lang kontekst | 76,0 % | — | — |
Mønsteret er klart: Opus vinder på opgaver, der kræver det dybeste og mest nyskabende ræsonnement — såsom refaktorering af hele kodebaser, forskning i flere trin og problemer, som modellen ikke har set før. Sonnet vinder på hastighedsfølsomme, produktionsklare opgaver.
Computerbrug: Den mest markante forbedring
Tallene for computerbrug (computer use) fortjener særlig opmærksomhed:
| Model | OSWorld-score | Tidslinje |
|---|---|---|
| Sonnet 3.5 (okt. 2024) | 14,9 % | Første lancering |
| Sonnet 4.5 | 61,4 % | +46,5 % |
| Sonnet 4.6 | 72,5 % | +11,1 % |
| Opus 4.6 | 72,7 % | Loftet |
| GPT-5.2 | 38,2 % | Til sammenligning |
På 16 måneder gik Sonnet fra 14,9 % til 72,5 % inden for computerbrug — en 4,9x forbedring. Jamie Cuffe, CEO for Pace (et forsikringsteknologiselskab), rapporterede, at Sonnet 4.6 ramte 94 % på deres interne benchmark for computerbrug: "Den ræsonnerer sig igennem fejl og selvretter på måder, vi ikke har set før."
Hvad er nyt i forhold til Sonnet 4.5
1. 1M token kontekstvindue (beta)
Kontekstvinduet udvides fra 200K til 1 million tokens. Det betyder, at hele kodebaser, omfattende juridiske dokumenter eller timers samtalehistorik kan være i én enkelt prompt.
En ny funktion til kontekst-kompaktering (også i beta) opsummerer automatisk ældre samtalesegmenter, hvilket reelt udvider den brugbare kontekst endnu mere.
2. Bedre instruktionsfølge, færre hallucinationer
Dette er, hvad udviklere lagde mærke til først. I test med Claude Code:
- 70 % foretrak Sonnet 4.6 frem for Sonnet 4.5
- 59 % foretrak den endda over Opus 4.5 (frontier-modellen fra november 2025)
- Læser eksisterende kode før ændring (i stedet for at gætte)
- Samler logik i stedet for at duplikere den
- Færre falske påstande om succes ("Jeg har rettet fejlen", når den ikke er rettet)
- Mindre "over-engineering" — tilføjer ikke unødvendige abstraktioner
- Bedre gennemførelse af opgaver i flere trin
3. Computerbrug bliver produktionsklar
Springet fra 61,4 % til 72,5 % på OSWorld krydser en tærskel. Brugere beskriver "kapabilitet på menneskeligt niveau i opgaver som at navigere i komplekse regneark eller udfylde webformularer i flere trin."
Sonnet 4.6 er også blevet væsentligt forbedret i forhold til modstandsdygtighed over for prompt injection ved computerbrug — og præsterer nu på Opus 4.6-niveau. Dette er afgørende for enhver agent, der browser på nettet eller behandler upålidelige input.
4. Udvidet tænkning + Adaptiv tænkning
Begge dele understøttes, hvilket lader modellen tildele flere beregningsressourcer til sværere problemer. Men bemærkelsesværdigt nok præsterer Sonnet 4.6 stærkt selv uden udvidet tænkning aktiveret — basismodellen er fundamentalt bedre.
5. Opgradering af den gratis version
Gratis Claude-brugere får nu Sonnet 4.6 som standard, plus:
- Mulighed for filoprettelse
- Connectorer (integrationer med eksterne data)
- Færdigheder (instruktioner der kan genbruges)
- Kontekst-kompaktering
Dette er den mest kraftfulde gratis AI-version, der er tilgængelig fra nogen større udbyder.
6. MCP-connectorer i Excel
Claude i Excel understøtter nu connectorer til S&P Global, LSEG, Daloopa, PitchBook, Moody's og FactSet — hvilket henter live finansielle data direkte ind i regneark.
Priser
Ingen prisændring i forhold til Sonnet 4.5:
| Plan | Pris |
|---|---|
| claude.ai Free | $0 (Sonnet 4.6 standard, brugsbegrænsninger) |
| claude.ai Pro | $20/md (højere grænser, Opus-adgang) |
| API input | $3 pr. million tokens |
| API output | $15 pr. million tokens |
Til sammenligning:
- Opus 4.6 API: $15/$75 pr. million tokens (5x dyrere)
- GPT-5.2 API: $5/$15 pr. million tokens (1.7x dyrere input)
- Gemini 3 Pro API: $7/$21 pr. million tokens (2.3x dyrere input)
Omkostning pr. Claude Code-session
For en typisk kodningssession (100K input + 20K output tokens):
| Model | Omkostning pr. session |
|---|---|
| Sonnet 4.6 | $0,60 |
| GPT-5.2 | $0,80 |
| Opus 4.6 | $3,00 |
Et team, der kører 100 agent-sessioner om dagen, sparer ca. $240 om dagen ved at bruge Sonnet 4.6 i stedet for Opus.
Sådan får du adgang
claude.ai
Allerede standard. Åbn claude.ai → du bruger Sonnet 4.6.Claude Code
claude # Sonnet 4.6 er nu standard
claude --model claude-sonnet-4-6-20250217 # eksplicit valg
API
Model-ID:claude-sonnet-4-6-20250217
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6-20250217",
max_tokens=4096,
messages=[{"role": "user", "content": "Your prompt here"}]
)
Skyplatforme
Tilgængelig på Amazon Bedrock og Google Cloud Vertex AI fra dag ét.Branchekontekst
Sonnet 4.6 er Anthropic's anden store udgivelse på 11 dage (efter Opus 4.6 den 6. februar). CNBC beskrev tempoet som en "fortsættelse af den hæsblæsende hastighed for udgivelser af AI-modeller." VentureBeat kaldte det "en seismisk prissætningsbegivenhed for AI-industrien."
Den overordnede tendens: Ydeevne-gulvet stiger. Det, der krævede en flagskibsmodel til $15/$75 for seks måneder siden, leveres nu til $3/$15. For udviklere af AI-produkter betyder det:
- AI-funktioner koster 5x mindre at køre
- Agenter til computerbrug er økonomisk rentable i stor skala
- Modellen er ikke længere flaskehalsen — det er eksekveringen
Bygger du med Claude Sonnet 4.6? Y Build integrerer med Claude Code til AI-assisteret udvikling og håndterer derefter deployment, Demo Cut-produktvideoer, AI SEO og analytics — hele stakken fra kode til vækst. Start gratis.
Kilder:
- Anthropic: Introducing Claude Sonnet 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship at one-fifth the cost
- 9to5Mac: Claude Sonnet 4.6 improved coding skills
- MacRumors: Claude Sonnet 4.6 improved coding, computer use
- MarkTechPost: Claude 4.6 Sonnet with 1M token context
- OfficeChai: Claude Sonnet 4.6 Benchmarks
- SiliconANGLE: Anthropic debuts Sonnet 4.6
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.