Claude Sonnet 4.6: Opus-tason tekoäly Sonnetin hinnalla

TL;DR

Anthropic julkaisi Claude Sonnet 4.6:n 17. helmikuuta 2026. Tärkeimmät asiat:

79.6% SWE-bench — lähes identtinen Opus 4.6:n (80.8%) kanssa todellisessa koodauksessa
72.5% OSWorld — käytännössä tasoissa Opus 4.6:n (72.7%) kanssa tietokoneen käytössä, lähes tuplasti GPT-5.2 (38.2%)
$3/$15 per miljoona tokenia — muuttumaton Sonnet 4.5:stä, 5 kertaa halvempi kuin Opus
1M tokenin konteksti-ikkuna (beta) — nousu 200K:sta
Nyt oletusmalli kaikille ilmais- ja Pro-käyttäjille

Kehittäjät suosivat Sonnet 4.6:ta Sonnet 4.5:n sijaan 70 % kerroista Claude Code -ympäristössä, ja jopa Opus 4.5:n ohi 59 % kerroista.

Mitä Anthropic julkisti

Claude Sonnet 4.6 on Anthropicin toinen merkittävä mallijulkaisu alle kahden viikon sisällä (seuraten Opus 4.6:ta 6. helmikuuta). Blogikirjoituksessaan Anthropic kuvailee sitä "mallin taitojen täydelliseksi päivitykseksi koodauksessa, tietokoneen käytössä, pitkän kontekstin päättelyssä, agenttien suunnittelussa, tietotyössä ja suunnittelussa."

Ydinviesti on: "Suorituskyky, joka aiemmin vaati Opus-luokan mallin — mukaan lukien todellisen maailman taloudellisesti arvokkaat toimistotehtävät — on nyt saatavilla Sonnet 4.6:lla."

Tämä on merkittävä lausunto. Anthropic sanoo käytännössä: useimmissa tuotantotason työkuormissa sinun ei enää tarvitse maksaa Opuksesta.

Kattava benchmark-analyysi

Missä Sonnet 4.6 vastaa tai voittaa Opus-mallin

Benchmark	Mitä testataan	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	Todellisen maailman koodaus	79.6%	80.8%	80.0%
OSWorld-Verified	Tietokoneen käyttö	72.5%	72.7%	38.2%
GDPval-AA (Elo)	Toimistotehtävät	1633	1606	1462
Finance Agent v1.1	Talousanalyysi	63.3%	60.1%	59.0%
OfficeQA	Asiakirjojen ymmärtäminen	Vastaa Opusta	—	—

Sonnet 4.6 on itse asiassa johdossa toimistotehtävissä ja talousanalyysissä — kahdessa taloudellisesti merkittävässä kategoriassa.

Missä Opus 4.6 säilyttää johtonsa

Benchmark	Mitä testataan	Opus 4.6	Sonnet 4.6	Ero
Terminal-Bench 2.0	Agenttipohjainen terminaalikoodaus	65.4%	59.1%	6.3%
BrowseComp	Agenttipohjainen verkkohaku	84.0%	74.7%	9.3%
ARC-AGI-2	Uudenlaisten ongelmien ratkaisu	68.8%	58.3%	10.5%
GPQA Diamond	Jatko-opiskelijatason päättely	91.3%	89.9%	1.4%
MRCR v2 (8-needle 1M)	Pitkän kontekstin päättely	76.0%	—	—

Malli on selkeä: Opus voittaa tehtävissä, jotka vaativat syvintä ja uudenlaisinta päättelyä — koodistotason refaktorointia, monivaiheista tutkimusta ja ongelmia, joita malli ei ole aiemmin nähnyt. Sonnet voittaa nopeuskriittisissä, tuotantovalmiissa tehtävissä.

Tietokoneen käyttö: Huomattava parannus

Tietokoneen käyttöä mittaavat luvut ansaitsevat erityistä huomiota:

Malli	OSWorld-tulos	Aikajana
Sonnet 3.5 (lokakuu 2024)	14.9%	Ensimmäinen julkaisu
Sonnet 4.5	61.4%	+46.5%
Sonnet 4.6	72.5%	+11.1%
Opus 4.6	72.7%	Katto
GPT-5.2	38.2%	Vertailun vuoksi

16 kuukaudessa Sonnet nousi 14,9 prosentista 72,5 prosenttiin tietokoneen käytössä — mikä on 4,9-kertainen parannus. Pace-vakuutusteknologiayhtiön toimitusjohtaja Jamie Cuffe raportoi, että Sonnet 4.6 saavutti 94 % heidän sisäisessä tietokoneen käytön benchmarkissaan: "Se päättelee virheiden läpi ja korjaa itseään tavoilla, joita emme ole aiemmin nähneet."

Mitä uutta verrattuna Sonnet 4.5:een

1. 1M tokenin konteksti-ikkuna (beta)

Konteksti-ikkuna laajenee 200 tuhannesta 1 miljoonaan tokeniin. Tämä tarkoittaa, että kokonaiset koodistot, pitkät oikeudelliset asiakirjat tai tuntien keskusteluhistoria mahtuvat yhteen promptiin.

Uusi kontekstin tiivistäminen -ominaisuus (myös beta-vaiheessa) tiivistää automaattisesti vanhemmat keskusteluosiot, laajentaen käytettävää kontekstia entisestään.

2. Parempi ohjeiden noudattaminen, vähemmän hallusinaatioita

Tämän kehittäjät huomasivat ensimmäisenä. Claude Code -testauksessa:

70 % suosi Sonnet 4.6:ta Sonnet 4.5:n sijaan
59 % suosi sitä jopa ohi Opus 4.5:n (marraskuun 2025 kärkipään malli)

Erityisiä mainittuja parannuksia:

Lukee olemassa olevan koodin ennen sen muokkaamista (arvailun sijaan)
Tiivistää logiikkaa sen monistamisen sijaan
Vähemmän vääriä väitteitä onnistumisesta ("Korjasin bugin", vaikka niin ei tapahtunut)
Vähemmän ylisuunnittelua — ei lisää tarpeettomia abstraktioita
Parempi loppuunsaattaminen monivaiheisissa tehtävissä

Cursorin perustajajäsen kutsui sitä "huomattavaksi parannukseksi verrattuna Sonnet 4.5:een kaikilla osa-alueilla, mukaan lukien pitkäkestoiset tehtävät ja vaikeammat ongelmat." GitHub raportoi "vahvoja ratkaisuprosentteja ja sellaista johdonmukaisuutta, jota kehittäjät tarvitsevat" monimutkaisissa koodistojen välisissä korjauksissa.

3. Tietokoneen käyttö muuttuu tuotantovalmiiksi

Hyppy 61,4 prosentista 72,5 prosenttiin OSWorld-testissä ylittää kriittisen kynnyksen. Käyttäjät kuvailevat "ihmistason kyvykkyyttä tehtävissä, kuten monimutkaisten taulukkolaskentaohjelmien navigoinnissa tai monivaiheisten verkkolomakkeiden täyttämisessä."

Sonnet 4.6 parani merkittävästi myös suojauksessa prompt-injektiota vastaan tietokoneen käytössä — suoriutuen Opus 4.6:n tasolla. Tämä on kriittistä agenteille, jotka selaavat verkkoa tai käsittelevät luottamatonta syötettä.

4. Extended Thinking + Adaptive Thinking

Molemmat ovat tuettuja, jolloin malli voi kohdentaa enemmän laskentatehoa vaikeisiin ongelmiin. Erityisesti Sonnet 4.6 suoriutuu vahvasti jopa ilman laajennettua ajattelua (extended thinking) — perusmalli on itsessään parempi.

5. Ilmaisen tason päivitys

Ilmaiset Claude-käyttäjät saavat nyt Sonnet 4.6:n oletuksena, plus:

Tiedostojen luontiominaisuudet

Konektorit (integraatiot ulkoiseen dataan)

Taidot (uudelleenkäytettävät ohjeet)

Kontekstin tiivistäminen

Tämä on kyvykkäin ilmainen AI-taso, jota mikään suuri toimija tarjoaa.

6. MCP-konektorit Excelissä

Claude Excelissä tukee nyt konektoreita S&P Global, LSEG, Daloopa, PitchBook, Moody's ja FactSet -palveluihin — tuoden reaaliaikaista talousdataa suoraan taulukkolaskentaan.

Hinnoittelu

Hinnat pysyvät samoina kuin Sonnet 4.5:ssä:

Tilaus	Hinta
claude.ai Free	$0 (Sonnet 4.6 oletus, käyttörajat)
claude.ai Pro	$20/kk (korkeammat rajat, pääsy Opukseen)
API input	$3 per miljoona tokenia
API output	$15 per miljoona tokenia

Vertailun vuoksi:

Opus 4.6 API: $15/$75 per miljoona tokenia (5x enemmän)

GPT-5.2 API: $5/$15 per miljoona tokenia (1.7x enemmän inputissa)

Gemini 3 Pro API: $7/$21 per miljoona tokenia (2.3x enemmän inputissa)

Kustannus per Claude Code -sessio

Tyypillinen koodaussessio (100K input + 20K output tokenia):

Malli	Kustannus per sessio
Sonnet 4.6	$0.60
GPT-5.2	$0.80
Opus 4.6	$3.00

Tiimi, joka ajaa 100 agenttisessiota päivässä, säästää n. $240/päivä käyttämällä Sonnet 4.6:ta Opuksen sijaan.

Kuinka ottaa käyttöön

claude.ai

Jo oletuksena. Avaa claude.ai → käytät Sonnet 4.6 -mallia.

Claude Code

bash

claude  # Sonnet 4.6 on nyt oletusmalli
claude --model claude-sonnet-4-6-20250217  # nimenomainen valinta

API

Mallin ID: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Pilvialustat

Saatavilla Amazon Bedrock ja Google Cloud Vertex AI -palveluissa ensimmäisestä päivästä lähtien.

Toimialan konteksti

Sonnet 4.6 on Anthropicin toinen suuri julkaisu 11 päivän sisällä (Opus 4.6:n jälkeen 6. helmikuuta). CNBC kuvaili tahtia "jatkuvaksi huimaksi vauhdiksi tekoälymallien julkaisuissa." VentureBeat kutsui sitä "tekoälyalan mullistavaksi hinnoittelumuutokseksi."

Laajempi suuntaus: suorituskyvyn vähimmäistaso nousee. Se, mikä vaati 15/75 dollarin lippulaivamallin kuusi kuukautta sitten, toimitetaan nyt hintaan 3/15 dollaria. Tekoälytuotteiden rakentajille tämä tarkoittaa:

Tekoälyominaisuuksien ajo maksaa 5 kertaa vähemmän
Tietokoneen käyttöön perustuvat agentit ovat taloudellisesti kannattavia suuressa mittakaavassa
Malli ei ole enää pullonkaula — julkaisunopeus on

Rakennatko Claude Sonnet 4.6:n avulla? Y Build integroituu Claude Codeen tekoälyavusteista kehitystä varten, ja hoitaa sitten käyttöönoton, Demo Cut -tuotevideot, AI SEO:n ja analytiikan — koko pino koodista kasvuun. Aloita ilmaiseksi.

Lähteet: