Claude Sonnet 4.6: AI på Opus-niveau til Sonnet-pris

TL;DR

Anthropic udgav Claude Sonnet 4.6 den 17. februar 2026. Det vigtigste at tage med:

79,6 % SWE-bench — næsten identisk med Opus 4.6 (80,8 %) til kodning i den virkelige verden
72,5 % OSWorld — i praksis det samme som Opus 4.6 (72,7 %) til computerbrug, næsten det dobbelte af GPT-5.2 (38,2 %)
$3/$15 pr. million tokens — uændret fra Sonnet 4.5, 5x billigere end Opus
1M token kontekstvindue (beta) — opgraderet fra 200K
Nu standardmodellen for alle gratis og Pro Claude-brugere

Udviklere foretrak Sonnet 4.6 frem for Sonnet 4.5 70 % af tiden i Claude Code, og foretrak den endda over Opus 4.5 59 % af tiden.

Hvad Anthropic annoncerede

Claude Sonnet 4.6 er Anthropic's anden store modeludgivelse på under to uger (efter Opus 4.6 den 6. februar). I deres blogindlæg beskriver Anthropic den som "en fuld opgradering af modellens færdigheder inden for kodning, computerbrug, ræsonnement med lang kontekst, agent-planlægning, vidensarbejde og design."

Kernebudskabet: "Ydeevne, som tidligere ville have krævet en model i Opus-klassen — herunder på økonomisk værdifulde kontoropgaver i den virkelige verden — er nu tilgængelig med Sonnet 4.6."

Dette er en markant udmelding. Anthropic siger reelt: For de fleste produktionsopgaver behøver du ikke længere betale for Opus.

Komplet gennemgang af benchmarks

Her matcher eller slår Sonnet 4.6 Opus

Benchmark	Hvad den tester	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	Kodning i den virkelige verden	79,6 %	80,8 %	80,0 %
OSWorld-Verified	Computerbrug	72,5 %	72,7 %	38,2 %
GDPval-AA (Elo)	Kontoropgaver	1633	1606	1462
Finance Agent v1.1	Finansiel analyse	63,3 %	60,1 %	59,0 %
OfficeQA	Dokumentforståelse	Matcher Opus	—	—

Sonnet 4.6 fører faktisk på kontoropgaver og finansiel analyse — to økonomisk betydningsfulde kategorier.

Her bevarer Opus 4.6 føringen

Benchmark	Hvad den tester	Opus 4.6	Sonnet 4.6	Forskel
Terminal-Bench 2.0	Agent-baseret terminal-kodning	65,4 %	59,1 %	6,3 %
BrowseComp	Agent-baseret websøgning	84,0 %	74,7 %	9,3 %
ARC-AGI-2	Nyskabende problemløsning	68,8 %	58,3 %	10,5 %
GPQA Diamond	Ræsonnement på kandidatniveau	91,3 %	89,9 %	1,4 %
MRCR v2 (8-needle 1M)	Ræsonnement med lang kontekst	76,0 %	—	—

Mønsteret er klart: Opus vinder på opgaver, der kræver det dybeste og mest nyskabende ræsonnement — såsom refaktorering af hele kodebaser, forskning i flere trin og problemer, som modellen ikke har set før. Sonnet vinder på hastighedsfølsomme, produktionsklare opgaver.

Computerbrug: Den mest markante forbedring

Tallene for computerbrug (computer use) fortjener særlig opmærksomhed:

Model	OSWorld-score	Tidslinje
Sonnet 3.5 (okt. 2024)	14,9 %	Første lancering
Sonnet 4.5	61,4 %	+46,5 %
Sonnet 4.6	72,5 %	+11,1 %
Opus 4.6	72,7 %	Loftet
GPT-5.2	38,2 %	Til sammenligning

På 16 måneder gik Sonnet fra 14,9 % til 72,5 % inden for computerbrug — en 4,9x forbedring. Jamie Cuffe, CEO for Pace (et forsikringsteknologiselskab), rapporterede, at Sonnet 4.6 ramte 94 % på deres interne benchmark for computerbrug: "Den ræsonnerer sig igennem fejl og selvretter på måder, vi ikke har set før."

Hvad er nyt i forhold til Sonnet 4.5

1. 1M token kontekstvindue (beta)

Kontekstvinduet udvides fra 200K til 1 million tokens. Det betyder, at hele kodebaser, omfattende juridiske dokumenter eller timers samtalehistorik kan være i én enkelt prompt.

En ny funktion til kontekst-kompaktering (også i beta) opsummerer automatisk ældre samtalesegmenter, hvilket reelt udvider den brugbare kontekst endnu mere.

2. Bedre instruktionsfølge, færre hallucinationer

Dette er, hvad udviklere lagde mærke til først. I test med Claude Code:

70 % foretrak Sonnet 4.6 frem for Sonnet 4.5
59 % foretrak den endda over Opus 4.5 (frontier-modellen fra november 2025)

Specifikke forbedringer inkluderer:

Læser eksisterende kode før ændring (i stedet for at gætte)
Samler logik i stedet for at duplikere den
Færre falske påstande om succes ("Jeg har rettet fejlen", når den ikke er rettet)
Mindre "over-engineering" — tilføjer ikke unødvendige abstraktioner
Bedre gennemførelse af opgaver i flere trin

Cursor's medstifter kaldte det "en mærkbar forbedring over Sonnet 4.5 over hele linjen, inklusive langsigtede opgaver og sværere problemer." GitHub rapporterede om "stærke løsningsrater og den form for konsistens, udviklere har brug for" ved komplekse fejlretninger på tværs af kodebaser.

3. Computerbrug bliver produktionsklar

Springet fra 61,4 % til 72,5 % på OSWorld krydser en tærskel. Brugere beskriver "kapabilitet på menneskeligt niveau i opgaver som at navigere i komplekse regneark eller udfylde webformularer i flere trin."

Sonnet 4.6 er også blevet væsentligt forbedret i forhold til modstandsdygtighed over for prompt injection ved computerbrug — og præsterer nu på Opus 4.6-niveau. Dette er afgørende for enhver agent, der browser på nettet eller behandler upålidelige input.

4. Udvidet tænkning + Adaptiv tænkning

Begge dele understøttes, hvilket lader modellen tildele flere beregningsressourcer til sværere problemer. Men bemærkelsesværdigt nok præsterer Sonnet 4.6 stærkt selv uden udvidet tænkning aktiveret — basismodellen er fundamentalt bedre.

5. Opgradering af den gratis version

Gratis Claude-brugere får nu Sonnet 4.6 som standard, plus:

Mulighed for filoprettelse

Connectorer (integrationer med eksterne data)

Færdigheder (instruktioner der kan genbruges)

Kontekst-kompaktering

Dette er den mest kraftfulde gratis AI-version, der er tilgængelig fra nogen større udbyder.

6. MCP-connectorer i Excel

Claude i Excel understøtter nu connectorer til S&P Global, LSEG, Daloopa, PitchBook, Moody's og FactSet — hvilket henter live finansielle data direkte ind i regneark.

Priser

Ingen prisændring i forhold til Sonnet 4.5:

Plan	Pris
claude.ai Free	$0 (Sonnet 4.6 standard, brugsbegrænsninger)
claude.ai Pro	$20/md (højere grænser, Opus-adgang)
API input	$3 pr. million tokens
API output	$15 pr. million tokens

Til sammenligning:

Opus 4.6 API: $15/$75 pr. million tokens (5x dyrere)

GPT-5.2 API: $5/$15 pr. million tokens (1.7x dyrere input)

Gemini 3 Pro API: $7/$21 pr. million tokens (2.3x dyrere input)

Omkostning pr. Claude Code-session

For en typisk kodningssession (100K input + 20K output tokens):

Model	Omkostning pr. session
Sonnet 4.6	$0,60
GPT-5.2	$0,80
Opus 4.6	$3,00

Et team, der kører 100 agent-sessioner om dagen, sparer ca. $240 om dagen ved at bruge Sonnet 4.6 i stedet for Opus.

Sådan får du adgang

claude.ai

Allerede standard. Åbn claude.ai → du bruger Sonnet 4.6.

Claude Code

bash

claude  # Sonnet 4.6 er nu standard
claude --model claude-sonnet-4-6-20250217  # eksplicit valg

API

Model-ID: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Skyplatforme

Tilgængelig på Amazon Bedrock og Google Cloud Vertex AI fra dag ét.

Branchekontekst

Sonnet 4.6 er Anthropic's anden store udgivelse på 11 dage (efter Opus 4.6 den 6. februar). CNBC beskrev tempoet som en "fortsættelse af den hæsblæsende hastighed for udgivelser af AI-modeller." VentureBeat kaldte det "en seismisk prissætningsbegivenhed for AI-industrien."

Den overordnede tendens: Ydeevne-gulvet stiger. Det, der krævede en flagskibsmodel til $15/$75 for seks måneder siden, leveres nu til $3/$15. For udviklere af AI-produkter betyder det:

AI-funktioner koster 5x mindre at køre
Agenter til computerbrug er økonomisk rentable i stor skala
Modellen er ikke længere flaskehalsen — det er eksekveringen

Bygger du med Claude Sonnet 4.6? Y Build integrerer med Claude Code til AI-assisteret udvikling og håndterer derefter deployment, Demo Cut-produktvideoer, AI SEO og analytics — hele stakken fra kode til vækst. Start gratis.

Kilder: