Claude Sonnet 4.6: ШІ рівня Opus за ціною Sonnet
Anthropic випустила Claude Sonnet 4.6 17 лютого 2026 року — модель забезпечує продуктивність, близьку до Opus, за 1/5 вартості. Повний розбір нових функцій, результати всіх бенчмарків, ціни, доступність та причини, чому розробники надають їй перевагу у 70% випадків порівняно з Sonnet 4.5.
Коротко про головне (TL;DR)
Anthropic випустила Claude Sonnet 4.6 17 лютого 2026 року. Головні тези:
- 79.6% SWE-bench — майже ідентично до Opus 4.6 (80.8%) у реальних задачах з програмування.
- 72.5% OSWorld — фактично на одному рівні з Opus 4.6 (72.7%) у задачах
computer use, що майже вдвічі перевищує показник GPT-5.2 (38.2%). - $3/$15 за мільйон токенів — ціна не змінилася порівняно з Sonnet 4.5, що у 5 разів дешевше за Opus.
- Контекстне вікно на 1 млн токенів (бета) — збільшено з 200 тисяч.
- Тепер це модель за замовчуванням для всіх користувачів Claude (Free та Pro).
Що анонсувала Anthropic
Claude Sonnet 4.6 — це вже другий великий реліз моделі від Anthropic менш ніж за два тижні (після виходу Opus 4.6 6 лютого). У своєму блозі Anthropic описує її як «повне оновлення навичок моделі в кодуванні, computer use, міркуванні з довгим контекстом, плануванні агентів, інтелектуальній роботі та дизайні».
Основне твердження: «Продуктивність, яка раніше вимагала використання моделі класу Opus — зокрема в реальних, економічно значущих офісних завданнях — тепер доступна в Sonnet 4.6».
Це вагома заява. Anthropic фактично каже: для більшості робочих навантажень вам більше не потрібно платити за Opus.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Повний розбір бенчмарків
Де Sonnet 4.6 наздоганяє або перевершує Opus
| Бенчмарк | Що тестує | Sonnet 4.6 | Opus 4.6 | GPT-5.2 |
|---|---|---|---|---|
| SWE-bench Verified | Програмування в реальних умова | 79.6% | 80.8% | 80.0% |
| OSWorld-Verified | Computer use | 72.5% | 72.7% | 38.2% |
| GDPval-AA (Elo) | Офісні завдання | 1633 | 1606 | 1462 |
| Finance Agent v1.1 | Фінансовий аналіз | 63.3% | 60.1% | 59.0% |
| OfficeQA | Розуміння документів | Відповідає Opus | — | — |
Sonnet 4.6 фактично лідирує в офісних завданнях та фінансовому аналізі — двох економічно важливих категоріях.
Де Opus 4.6 зберігає лідерство
| Бенчмарк | Що тестує | Opus 4.6 | Sonnet 4.6 | Різниця |
|---|---|---|---|---|
| Terminal-Bench 2.0 | Агентне кодування в терміналі | 65.4% | 59.1% | 6.3% |
| BrowseComp | Агентний веб-пошук | 84.0% | 74.7% | 9.3% |
| ARC-AGI-2 | Вирішення нових типів задач | 68.8% | 58.3% | 10.5% |
| GPQA Diamond | Міркування на рівні випускника ВНЗ | 91.3% | 89.9% | 1.4% |
| MRCR v2 (8-needle 1M) | Міркування з довгим контекстом | 76.0% | — | — |
Закономірність очевидна: Opus перемагає в завданнях, що потребують найглибших та найновіших міркувань — рефакторинг на рівні всієї кодової бази, багатоетапні дослідження та проблеми, з якими модель раніше не стикалася. Sonnet перемагає у задачах, де важлива швидкість та готовність до використання у продакшені.
Computer Use: Найпомітніше покращення
Показники computer use заслуговують на особливу увагу:
| Модель | Показник OSWorld | Часова шкала |
|---|---|---|
| Sonnet 3.5 (Жовтень 2024) | 14.9% | Перший запуск |
| Sonnet 4.5 | 61.4% | +46.5% |
| Sonnet 4.6 | 72.5% | +11.1% |
| Opus 4.6 | 72.7% | Стеля |
| GPT-5.2 | 38.2% | Для порівняння |
За 16 місяців Sonnet пройшла шлях від 14.9% до 72.5% у computer use — це покращення у 4.9 раза. Джеймі Кафф, CEO Pace (страхова тех-компанія), повідомив, що Sonnet 4.6 досягла 94% у їхньому внутрішньому бенчмарку computer use: «Вона аналізує помилки та самостійно виправляє їх так, як ми не бачили раніше».
Що нового порівняно з Sonnet 4.5
1. Контекстне вікно на 1 млн токенів (Бета)
Контекстне вікно розширюється з 200 тисяч до 1 мільйона токенів. Це означає, що цілі кодові бази, величезні юридичні документи або багатогодинні історії розмов тепер вміщуються в один промпт.
Нова функція context compaction (також у беті) автоматично підсумовує старі сегменти розмови, фактично розширюючи корисний контекст ще більше.
2. Краще дотримання інструкцій, менше галюцинацій
Це те, що розробники помітили першим. Тестування в Claude Code показало:
- 70% віддали перевагу Sonnet 4.6 перед Sonnet 4.5.
- 59% надали їй перевагу навіть перед Opus 4.5 (флагманською моделлю листопада 2025 року).
- Читає існуючий код перед його модифікацією (замість вгадування).
- Консолідує логіку замість її дублювання.
- Менше хибних заяв про успіх («Я виправив баг», коли це не так).
- Менше надмірного ускладнення (over-engineering) — не додає непотрібних абстракцій.
- Краще доведення до кінця багатоетапних завдань.
3. Computer Use готовий до продакшену
Стрибок з 61.4% до 72.5% в OSWorld долає певний поріг. Користувачі описують це як «здатність людського рівня у таких завданнях, як навігація складними таблицями або заповнення багатоетапних веб-форм».
Sonnet 4.6 також значно покращила стійкість до промпт-ін'єкцій для computer use, досягнувши рівня Opus 4.6. Це критично важливо для будь-якого агента, який переглядає веб-сторінки або обробляє неперевірені дані.
4. Extended Thinking + Adaptive Thinking
Обидві функції підтримуються, дозволяючи моделі виділяти більше обчислювальних ресурсів для складних завдань. Але варто зазначити, що Sonnet 4.6 працює потужно навіть без активованого extended thinking — базова модель стала фундаментально кращою.
5. Оновлення безкоштовного тарифу
Користувачі безкоштовної версії Claude тепер отримують Sonnet 4.6 за замовчуванням, а також:
- Можливість створення файлів.
- Коннектори (інтеграція з зовнішніми даними).
- Skills (інструкції багаторазового використання).
- Context compaction.
Це найбільш функціональний безкоштовний тариф ШІ серед усіх великих провайдерів.
6. Коннектори MCP в Excel
Claude в Excel тепер підтримує коннектори для S&P Global, LSEG, Daloopa, PitchBook, Moody’s та FactSet, що дозволяє завантажувати актуальні фінансові дані безпосередньо в таблиці.
Ціноутворення
Ціна не змінилася порівняно з Sonnet 4.5:
| План | Ціна |
|---|---|
| claude.ai Free | $0 (Sonnet 4.6 за замовчуванням, ліміти використання) |
| claude.ai Pro | $20/міс (вищі ліміти, доступ до Opus) |
| API input | $3 за мільйон токенів |
| API output | $15 за мільйон токенів |
Для порівняння:
- Opus 4.6 API: $15/$75 за мільйон токенів (у 5 разів дорожче).
- GPT-5.2 API: $5/$15 за мільйон токенів (у 1.7 раза дорожче на вхід).
- Gemini 3 Pro API: $7/$21 за мільйон токенів (у 2.3 раза дорожче на вхід).
Вартість сесії Claude Code
Для типової сесії програмування (100K вхідних + 20K вихідних токенів):
| Модель | Вартість сесії |
|---|---|
| Sonnet 4.6 | $0.60 |
| GPT-5.2 | $0.80 |
| Opus 4.6 | $3.00 |
Команда, що проводить 100 агентних сесій на день, заощаджує ~$240/день, використовуючи Sonnet 4.6 замість Opus.
Як отримати доступ
claude.ai
Вже встановлено за замовчуванням. Відкрийте claude.ai — ви вже використовуєте Sonnet 4.6.Claude Code
claude # Sonnet 4.6 тепер є моделлю за замовчуванням
claude --model claude-sonnet-4-6-20250217 # явний вибір моделі
API
Model ID:claude-sonnet-4-6-20250217
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6-20250217",
max_tokens=4096,
messages=[{"role": "user", "content": "Your prompt here"}]
)
Хмарні платформи
Модель доступна на Amazon Bedrock та Google Cloud Vertex AI з першого дня.Контекст індустрії
Sonnet 4.6 — це другий великий реліз Anthropic за 11 днів (після Opus 4.6 6 лютого). CNBC описав такий темп як «продовження запаморочливої швидкості випуску моделей ШІ». VentureBeat назвав це «сейсмічною подією у зміні ціноутворення для індустрії ШІ».
Загальний тренд: мінімальний рівень продуктивності зростає. Те, що шість місяців тому вимагало флагманської моделі за $15/$75, тепер доступне за $3/$15. Для розробників ШІ-продуктів це означає:
- Запуск функцій ШІ коштує в 5 разів дешевше.
- Агенти
computer useстають економічно вигідними в масштабі. - Модель більше не є вузьким місцем — головним стає швидкість виходу на ринок.
Будуєте продукти з Claude Sonnet 4.6? Y Build інтегрується з Claude Code для розробки за допомогою ШІ, а потім бере на себе деплой, створення продуктових відео Demo Cut, AI SEO та аналітику — повний цикл від коду до зростання. Почніть безкоштовно.
Джерела:
- Anthropic: Introducing Claude Sonnet 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship at one-fifth the cost
- 9to5Mac: Claude Sonnet 4.6 improved coding skills
- MacRumors: Claude Sonnet 4.6 improved coding, computer use
- MarkTechPost: Claude 4.6 Sonnet with 1M token context
- OfficeChai: Claude Sonnet 4.6 Benchmarks
- SiliconANGLE: Anthropic debuts Sonnet 4.6
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.