Claude Sonnet 4.6: Opus-tason tekoäly Sonnetin hinnalla
Anthropic julkaisi Claude Sonnet 4.6:n 17. helmikuuta 2026 — tarjoten lähes Opus-tason suorituskykyä viidesosalla hinnasta. Täydellinen katsaus uusiin ominaisuuksiin, kaikki benchmark-tulokset, hinnoittelu, saatavuus ja miksi kehittäjät suosivat sitä 70 % useammin kuin Sonnet 4.5 -mallia.
TL;DR
Anthropic julkaisi Claude Sonnet 4.6:n 17. helmikuuta 2026. Tärkeimmät asiat:
- 79.6% SWE-bench — lähes identtinen Opus 4.6:n (80.8%) kanssa todellisessa koodauksessa
- 72.5% OSWorld — käytännössä tasoissa Opus 4.6:n (72.7%) kanssa tietokoneen käytössä, lähes tuplasti GPT-5.2 (38.2%)
- $3/$15 per miljoona tokenia — muuttumaton Sonnet 4.5:stä, 5 kertaa halvempi kuin Opus
- 1M tokenin konteksti-ikkuna (beta) — nousu 200K:sta
- Nyt oletusmalli kaikille ilmais- ja Pro-käyttäjille
Mitä Anthropic julkisti
Claude Sonnet 4.6 on Anthropicin toinen merkittävä mallijulkaisu alle kahden viikon sisällä (seuraten Opus 4.6:ta 6. helmikuuta). Blogikirjoituksessaan Anthropic kuvailee sitä "mallin taitojen täydelliseksi päivitykseksi koodauksessa, tietokoneen käytössä, pitkän kontekstin päättelyssä, agenttien suunnittelussa, tietotyössä ja suunnittelussa."
Ydinviesti on: "Suorituskyky, joka aiemmin vaati Opus-luokan mallin — mukaan lukien todellisen maailman taloudellisesti arvokkaat toimistotehtävät — on nyt saatavilla Sonnet 4.6:lla."
Tämä on merkittävä lausunto. Anthropic sanoo käytännössä: useimmissa tuotantotason työkuormissa sinun ei enää tarvitse maksaa Opuksesta.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Kattava benchmark-analyysi
Missä Sonnet 4.6 vastaa tai voittaa Opus-mallin
| Benchmark | Mitä testataan | Sonnet 4.6 | Opus 4.6 | GPT-5.2 |
|---|---|---|---|---|
| SWE-bench Verified | Todellisen maailman koodaus | 79.6% | 80.8% | 80.0% |
| OSWorld-Verified | Tietokoneen käyttö | 72.5% | 72.7% | 38.2% |
| GDPval-AA (Elo) | Toimistotehtävät | 1633 | 1606 | 1462 |
| Finance Agent v1.1 | Talousanalyysi | 63.3% | 60.1% | 59.0% |
| OfficeQA | Asiakirjojen ymmärtäminen | Vastaa Opusta | — | — |
Sonnet 4.6 on itse asiassa johdossa toimistotehtävissä ja talousanalyysissä — kahdessa taloudellisesti merkittävässä kategoriassa.
Missä Opus 4.6 säilyttää johtonsa
| Benchmark | Mitä testataan | Opus 4.6 | Sonnet 4.6 | Ero |
|---|---|---|---|---|
| Terminal-Bench 2.0 | Agenttipohjainen terminaalikoodaus | 65.4% | 59.1% | 6.3% |
| BrowseComp | Agenttipohjainen verkkohaku | 84.0% | 74.7% | 9.3% |
| ARC-AGI-2 | Uudenlaisten ongelmien ratkaisu | 68.8% | 58.3% | 10.5% |
| GPQA Diamond | Jatko-opiskelijatason päättely | 91.3% | 89.9% | 1.4% |
| MRCR v2 (8-needle 1M) | Pitkän kontekstin päättely | 76.0% | — | — |
Malli on selkeä: Opus voittaa tehtävissä, jotka vaativat syvintä ja uudenlaisinta päättelyä — koodistotason refaktorointia, monivaiheista tutkimusta ja ongelmia, joita malli ei ole aiemmin nähnyt. Sonnet voittaa nopeuskriittisissä, tuotantovalmiissa tehtävissä.
Tietokoneen käyttö: Huomattava parannus
Tietokoneen käyttöä mittaavat luvut ansaitsevat erityistä huomiota:
| Malli | OSWorld-tulos | Aikajana |
|---|---|---|
| Sonnet 3.5 (lokakuu 2024) | 14.9% | Ensimmäinen julkaisu |
| Sonnet 4.5 | 61.4% | +46.5% |
| Sonnet 4.6 | 72.5% | +11.1% |
| Opus 4.6 | 72.7% | Katto |
| GPT-5.2 | 38.2% | Vertailun vuoksi |
16 kuukaudessa Sonnet nousi 14,9 prosentista 72,5 prosenttiin tietokoneen käytössä — mikä on 4,9-kertainen parannus. Pace-vakuutusteknologiayhtiön toimitusjohtaja Jamie Cuffe raportoi, että Sonnet 4.6 saavutti 94 % heidän sisäisessä tietokoneen käytön benchmarkissaan: "Se päättelee virheiden läpi ja korjaa itseään tavoilla, joita emme ole aiemmin nähneet."
Mitä uutta verrattuna Sonnet 4.5:een
1. 1M tokenin konteksti-ikkuna (beta)
Konteksti-ikkuna laajenee 200 tuhannesta 1 miljoonaan tokeniin. Tämä tarkoittaa, että kokonaiset koodistot, pitkät oikeudelliset asiakirjat tai tuntien keskusteluhistoria mahtuvat yhteen promptiin.
Uusi kontekstin tiivistäminen -ominaisuus (myös beta-vaiheessa) tiivistää automaattisesti vanhemmat keskusteluosiot, laajentaen käytettävää kontekstia entisestään.
2. Parempi ohjeiden noudattaminen, vähemmän hallusinaatioita
Tämän kehittäjät huomasivat ensimmäisenä. Claude Code -testauksessa:
- 70 % suosi Sonnet 4.6:ta Sonnet 4.5:n sijaan
- 59 % suosi sitä jopa ohi Opus 4.5:n (marraskuun 2025 kärkipään malli)
- Lukee olemassa olevan koodin ennen sen muokkaamista (arvailun sijaan)
- Tiivistää logiikkaa sen monistamisen sijaan
- Vähemmän vääriä väitteitä onnistumisesta ("Korjasin bugin", vaikka niin ei tapahtunut)
- Vähemmän ylisuunnittelua — ei lisää tarpeettomia abstraktioita
- Parempi loppuunsaattaminen monivaiheisissa tehtävissä
3. Tietokoneen käyttö muuttuu tuotantovalmiiksi
Hyppy 61,4 prosentista 72,5 prosenttiin OSWorld-testissä ylittää kriittisen kynnyksen. Käyttäjät kuvailevat "ihmistason kyvykkyyttä tehtävissä, kuten monimutkaisten taulukkolaskentaohjelmien navigoinnissa tai monivaiheisten verkkolomakkeiden täyttämisessä."
Sonnet 4.6 parani merkittävästi myös suojauksessa prompt-injektiota vastaan tietokoneen käytössä — suoriutuen Opus 4.6:n tasolla. Tämä on kriittistä agenteille, jotka selaavat verkkoa tai käsittelevät luottamatonta syötettä.
4. Extended Thinking + Adaptive Thinking
Molemmat ovat tuettuja, jolloin malli voi kohdentaa enemmän laskentatehoa vaikeisiin ongelmiin. Erityisesti Sonnet 4.6 suoriutuu vahvasti jopa ilman laajennettua ajattelua (extended thinking) — perusmalli on itsessään parempi.
5. Ilmaisen tason päivitys
Ilmaiset Claude-käyttäjät saavat nyt Sonnet 4.6:n oletuksena, plus:
- Tiedostojen luontiominaisuudet
- Konektorit (integraatiot ulkoiseen dataan)
- Taidot (uudelleenkäytettävät ohjeet)
- Kontekstin tiivistäminen
Tämä on kyvykkäin ilmainen AI-taso, jota mikään suuri toimija tarjoaa.
6. MCP-konektorit Excelissä
Claude Excelissä tukee nyt konektoreita S&P Global, LSEG, Daloopa, PitchBook, Moody's ja FactSet -palveluihin — tuoden reaaliaikaista talousdataa suoraan taulukkolaskentaan.
Hinnoittelu
Hinnat pysyvät samoina kuin Sonnet 4.5:ssä:
| Tilaus | Hinta |
|---|---|
| claude.ai Free | $0 (Sonnet 4.6 oletus, käyttörajat) |
| claude.ai Pro | $20/kk (korkeammat rajat, pääsy Opukseen) |
| API input | $3 per miljoona tokenia |
| API output | $15 per miljoona tokenia |
Vertailun vuoksi:
- Opus 4.6 API: $15/$75 per miljoona tokenia (5x enemmän)
- GPT-5.2 API: $5/$15 per miljoona tokenia (1.7x enemmän inputissa)
- Gemini 3 Pro API: $7/$21 per miljoona tokenia (2.3x enemmän inputissa)
Kustannus per Claude Code -sessio
Tyypillinen koodaussessio (100K input + 20K output tokenia):
| Malli | Kustannus per sessio |
|---|---|
| Sonnet 4.6 | $0.60 |
| GPT-5.2 | $0.80 |
| Opus 4.6 | $3.00 |
Tiimi, joka ajaa 100 agenttisessiota päivässä, säästää n. $240/päivä käyttämällä Sonnet 4.6:ta Opuksen sijaan.
Kuinka ottaa käyttöön
claude.ai
Jo oletuksena. Avaa claude.ai → käytät Sonnet 4.6 -mallia.Claude Code
claude # Sonnet 4.6 on nyt oletusmalli
claude --model claude-sonnet-4-6-20250217 # nimenomainen valinta
API
Mallin ID:claude-sonnet-4-6-20250217
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6-20250217",
max_tokens=4096,
messages=[{"role": "user", "content": "Your prompt here"}]
)
Pilvialustat
Saatavilla Amazon Bedrock ja Google Cloud Vertex AI -palveluissa ensimmäisestä päivästä lähtien.Toimialan konteksti
Sonnet 4.6 on Anthropicin toinen suuri julkaisu 11 päivän sisällä (Opus 4.6:n jälkeen 6. helmikuuta). CNBC kuvaili tahtia "jatkuvaksi huimaksi vauhdiksi tekoälymallien julkaisuissa." VentureBeat kutsui sitä "tekoälyalan mullistavaksi hinnoittelumuutokseksi."
Laajempi suuntaus: suorituskyvyn vähimmäistaso nousee. Se, mikä vaati 15/75 dollarin lippulaivamallin kuusi kuukautta sitten, toimitetaan nyt hintaan 3/15 dollaria. Tekoälytuotteiden rakentajille tämä tarkoittaa:
- Tekoälyominaisuuksien ajo maksaa 5 kertaa vähemmän
- Tietokoneen käyttöön perustuvat agentit ovat taloudellisesti kannattavia suuressa mittakaavassa
- Malli ei ole enää pullonkaula — julkaisunopeus on
Rakennatko Claude Sonnet 4.6:n avulla? Y Build integroituu Claude Codeen tekoälyavusteista kehitystä varten, ja hoitaa sitten käyttöönoton, Demo Cut -tuotevideot, AI SEO:n ja analytiikan — koko pino koodista kasvuun. Aloita ilmaiseksi.
Lähteet:
- Anthropic: Introducing Claude Sonnet 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship at one-fifth the cost
- 9to5Mac: Claude Sonnet 4.6 improved coding skills
- MacRumors: Claude Sonnet 4.6 improved coding, computer use
- MarkTechPost: Claude 4.6 Sonnet with 1M token context
- OfficeChai: Claude Sonnet 4.6 Benchmarks
- SiliconANGLE: Anthropic debuts Sonnet 4.6
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.