Claude Sonnet 4.6: ШІ рівня Opus за ціною Sonnet

Коротко про головне (TL;DR)

Anthropic випустила Claude Sonnet 4.6 17 лютого 2026 року. Головні тези:

79.6% SWE-bench — майже ідентично до Opus 4.6 (80.8%) у реальних задачах з програмування.
72.5% OSWorld — фактично на одному рівні з Opus 4.6 (72.7%) у задачах computer use, що майже вдвічі перевищує показник GPT-5.2 (38.2%).
$3/$15 за мільйон токенів — ціна не змінилася порівняно з Sonnet 4.5, що у 5 разів дешевше за Opus.
Контекстне вікно на 1 млн токенів (бета) — збільшено з 200 тисяч.
Тепер це модель за замовчуванням для всіх користувачів Claude (Free та Pro).

Розробники віддавали перевагу Sonnet 4.6 перед Sonnet 4.5 у 70% випадків під час використання Claude Code, і навіть обирали її частіше за Opus 4.5 у 59% випадків.

Що анонсувала Anthropic

Claude Sonnet 4.6 — це вже другий великий реліз моделі від Anthropic менш ніж за два тижні (після виходу Opus 4.6 6 лютого). У своєму блозі Anthropic описує її як «повне оновлення навичок моделі в кодуванні, computer use, міркуванні з довгим контекстом, плануванні агентів, інтелектуальній роботі та дизайні».

Основне твердження: «Продуктивність, яка раніше вимагала використання моделі класу Opus — зокрема в реальних, економічно значущих офісних завданнях — тепер доступна в Sonnet 4.6».

Це вагома заява. Anthropic фактично каже: для більшості робочих навантажень вам більше не потрібно платити за Opus.

Повний розбір бенчмарків

Де Sonnet 4.6 наздоганяє або перевершує Opus

Бенчмарк	Що тестує	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	Програмування в реальних умова	79.6%	80.8%	80.0%
OSWorld-Verified	Computer use	72.5%	72.7%	38.2%
GDPval-AA (Elo)	Офісні завдання	1633	1606	1462
Finance Agent v1.1	Фінансовий аналіз	63.3%	60.1%	59.0%
OfficeQA	Розуміння документів	Відповідає Opus	—	—

Sonnet 4.6 фактично лідирує в офісних завданнях та фінансовому аналізі — двох економічно важливих категоріях.

Де Opus 4.6 зберігає лідерство

Бенчмарк	Що тестує	Opus 4.6	Sonnet 4.6	Різниця
Terminal-Bench 2.0	Агентне кодування в терміналі	65.4%	59.1%	6.3%
BrowseComp	Агентний веб-пошук	84.0%	74.7%	9.3%
ARC-AGI-2	Вирішення нових типів задач	68.8%	58.3%	10.5%
GPQA Diamond	Міркування на рівні випускника ВНЗ	91.3%	89.9%	1.4%
MRCR v2 (8-needle 1M)	Міркування з довгим контекстом	76.0%	—	—

Закономірність очевидна: Opus перемагає в завданнях, що потребують найглибших та найновіших міркувань — рефакторинг на рівні всієї кодової бази, багатоетапні дослідження та проблеми, з якими модель раніше не стикалася. Sonnet перемагає у задачах, де важлива швидкість та готовність до використання у продакшені.

Computer Use: Найпомітніше покращення

Показники computer use заслуговують на особливу увагу:

Модель	Показник OSWorld	Часова шкала
Sonnet 3.5 (Жовтень 2024)	14.9%	Перший запуск
Sonnet 4.5	61.4%	+46.5%
Sonnet 4.6	72.5%	+11.1%
Opus 4.6	72.7%	Стеля
GPT-5.2	38.2%	Для порівняння

За 16 місяців Sonnet пройшла шлях від 14.9% до 72.5% у computer use — це покращення у 4.9 раза. Джеймі Кафф, CEO Pace (страхова тех-компанія), повідомив, що Sonnet 4.6 досягла 94% у їхньому внутрішньому бенчмарку computer use: «Вона аналізує помилки та самостійно виправляє їх так, як ми не бачили раніше».

Що нового порівняно з Sonnet 4.5

1. Контекстне вікно на 1 млн токенів (Бета)

Контекстне вікно розширюється з 200 тисяч до 1 мільйона токенів. Це означає, що цілі кодові бази, величезні юридичні документи або багатогодинні історії розмов тепер вміщуються в один промпт.

Нова функція context compaction (також у беті) автоматично підсумовує старі сегменти розмови, фактично розширюючи корисний контекст ще більше.

2. Краще дотримання інструкцій, менше галюцинацій

Це те, що розробники помітили першим. Тестування в Claude Code показало:

70% віддали перевагу Sonnet 4.6 перед Sonnet 4.5.
59% надали їй перевагу навіть перед Opus 4.5 (флагманською моделлю листопада 2025 року).

Серед конкретних покращень виділяють:

Читає існуючий код перед його модифікацією (замість вгадування).
Консолідує логіку замість її дублювання.
Менше хибних заяв про успіх («Я виправив баг», коли це не так).
Менше надмірного ускладнення (over-engineering) — не додає непотрібних абстракцій.
Краще доведення до кінця багатоетапних завдань.

Співзасновник Cursor назвав це «помітним покращенням порівняно з Sonnet 4.5 за всіма показниками, включаючи довгострокові завдання та складніші проблеми». GitHub повідомив про «високі показники вирішення завдань та послідовність, необхідну розробникам» для складних виправлень у кількох репозиторіях одночасно.

3. Computer Use готовий до продакшену

Стрибок з 61.4% до 72.5% в OSWorld долає певний поріг. Користувачі описують це як «здатність людського рівня у таких завданнях, як навігація складними таблицями або заповнення багатоетапних веб-форм».

Sonnet 4.6 також значно покращила стійкість до промпт-ін'єкцій для computer use, досягнувши рівня Opus 4.6. Це критично важливо для будь-якого агента, який переглядає веб-сторінки або обробляє неперевірені дані.

4. Extended Thinking + Adaptive Thinking

Обидві функції підтримуються, дозволяючи моделі виділяти більше обчислювальних ресурсів для складних завдань. Але варто зазначити, що Sonnet 4.6 працює потужно навіть без активованого extended thinking — базова модель стала фундаментально кращою.

5. Оновлення безкоштовного тарифу

Користувачі безкоштовної версії Claude тепер отримують Sonnet 4.6 за замовчуванням, а також:

Можливість створення файлів.

Коннектори (інтеграція з зовнішніми даними).

Skills (інструкції багаторазового використання).

Context compaction.

Це найбільш функціональний безкоштовний тариф ШІ серед усіх великих провайдерів.

6. Коннектори MCP в Excel

Claude в Excel тепер підтримує коннектори для S&P Global, LSEG, Daloopa, PitchBook, Moody’s та FactSet, що дозволяє завантажувати актуальні фінансові дані безпосередньо в таблиці.

Ціноутворення

Ціна не змінилася порівняно з Sonnet 4.5:

План	Ціна
claude.ai Free	$0 (Sonnet 4.6 за замовчуванням, ліміти використання)
claude.ai Pro	$20/міс (вищі ліміти, доступ до Opus)
API input	$3 за мільйон токенів
API output	$15 за мільйон токенів

Для порівняння:

Opus 4.6 API: $15/$75 за мільйон токенів (у 5 разів дорожче).

GPT-5.2 API: $5/$15 за мільйон токенів (у 1.7 раза дорожче на вхід).

Gemini 3 Pro API: $7/$21 за мільйон токенів (у 2.3 раза дорожче на вхід).

Вартість сесії Claude Code

Для типової сесії програмування (100K вхідних + 20K вихідних токенів):

Модель	Вартість сесії
Sonnet 4.6	$0.60
GPT-5.2	$0.80
Opus 4.6	$3.00

Команда, що проводить 100 агентних сесій на день, заощаджує ~$240/день, використовуючи Sonnet 4.6 замість Opus.

Як отримати доступ

claude.ai

Вже встановлено за замовчуванням. Відкрийте claude.ai — ви вже використовуєте Sonnet 4.6.

Claude Code

bash

claude  # Sonnet 4.6 тепер є моделлю за замовчуванням
claude --model claude-sonnet-4-6-20250217  # явний вибір моделі

API

Model ID: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Хмарні платформи

Модель доступна на Amazon Bedrock та Google Cloud Vertex AI з першого дня.

Контекст індустрії

Sonnet 4.6 — це другий великий реліз Anthropic за 11 днів (після Opus 4.6 6 лютого). CNBC описав такий темп як «продовження запаморочливої швидкості випуску моделей ШІ». VentureBeat назвав це «сейсмічною подією у зміні ціноутворення для індустрії ШІ».

Загальний тренд: мінімальний рівень продуктивності зростає. Те, що шість місяців тому вимагало флагманської моделі за $15/$75, тепер доступне за $3/$15. Для розробників ШІ-продуктів це означає:

Запуск функцій ШІ коштує в 5 разів дешевше.
Агенти computer use стають економічно вигідними в масштабі.
Модель більше не є вузьким місцем — головним стає швидкість виходу на ринок.

Будуєте продукти з Claude Sonnet 4.6? Y Build інтегрується з Claude Code для розробки за допомогою ШІ, а потім бере на себе деплой, створення продуктових відео Demo Cut, AI SEO та аналітику — повний цикл від коду до зростання. Почніть безкоштовно.

Джерела: