Claude Sonnet 4.6: ИИ уровня Opus по цене Sonnet

TL;DR

Anthropic выпустила Claude Sonnet 4.6 17 февраля 2026 года. Основные выводы:

79.6% SWE-bench — практически идентично Opus 4.6 (80.8%) в реальном написании кода
72.5% OSWorld — фактически на одном уровне с Opus 4.6 (72.7%) в использовании компьютера, почти в два раза выше GPT-5.2 (38.2%)
$3/$15 за миллион токенов — цена не изменилась по сравнению с Sonnet 4.5, что в 5 раз дешевле Opus
Окно контекста 1M токенов (бета) — увеличено с 200K
Теперь это модель по умолчанию для всех пользователей Free и Pro версий Claude

Разработчики предпочитали Sonnet 4.6 модели Sonnet 4.5 в 70% случаев в Claude Code и даже отдавали ей предпочтение перед Opus 4.5 в 59% случаев.

Что анонсировала Anthropic

Claude Sonnet 4.6 — это второй крупный релиз модели от Anthropic менее чем за две недели (после Opus 4.6 от 6 февраля). В своем блоге Anthropic описывает её как «полное обновление навыков модели в области кодинга, использования компьютера, рассуждений с длинным контекстом, планирования агентов, интеллектуальной работы и дизайна».

Ключевое утверждение: «Производительность, для которой раньше требовалась модель класса Opus — в том числе в реальных, экономически значимых офисных задачах — теперь доступна в Sonnet 4.6».

Это серьезное заявление. Anthropic фактически говорит: для большинства рабочих задач в продакшене вам больше не нужно платить за Opus.

Полный разбор бенчмарков

Где Sonnet 4.6 догоняет или опережает Opus

Бенчмарк	Что тестирует	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	Написание кода в реальных условиях	79.6%	80.8%	80.0%
OSWorld-Verified	Использование компьютера	72.5%	72.7%	38.2%
GDPval-AA (Elo)	Офисные задачи	1633	1606	1462
Finance Agent v1.1	Финансовый анализ	63.3%	60.1%	59.0%
OfficeQA	Понимание документов	На уровне Opus	—	—

Sonnet 4.6 фактически лидирует в офисных задачах и финансовом анализе — двух экономически значимых категориях.

Где Opus 4.6 сохраняет лидерство

Бенчмарк	Что тестирует	Opus 4.6	Sonnet 4.6	Разрыв
Terminal-Bench 2.0	Агентное написание кода в терминале	65.4%	59.1%	6.3%
BrowseComp	Агентный поиск в вебе	84.0%	74.7%	9.3%
ARC-AGI-2	Решение новых задач	68.8%	58.3%	10.5%
GPQA Diamond	Рассуждения на уровне выпускника вуза	91.3%	89.9%	1.4%
MRCR v2 (8-needle 1M)	Рассуждения с длинным контекстом	76.0%	—	—

Закономерность очевидна: Opus побеждает в задачах, требующих наиболее глубоких и нестандартных рассуждений — рефакторинг кодовой базы целиком, многоэтапные исследования и задачи, с которыми модель не сталкивалась ранее. Sonnet побеждает в задачах, готовых к использованию в продакшене, где важна скорость.

Использование компьютера: заметный прорыв

Показатели использования компьютера (computer use) заслуживают особого внимания:

Модель	Результат OSWorld	Хронология
Sonnet 3.5 (Октябрь 2024)	14.9%	Первый запуск
Sonnet 4.5	61.4%	+46.5%
Sonnet 4.6	72.5%	+11.1%
Opus 4.6	72.7%	Потолок
GPT-5.2	38.2%	Для сравнения

За 16 месяцев Sonnet прошла путь от 14.9% до 72.5% в использовании компьютера — это улучшение в 4.9 раза. Джейми Кафф, CEO Pace (компания в сфере страховых технологий), сообщил, что Sonnet 4.6 набрала 94% в их внутреннем бенчмарке использования компьютера: «Она анализирует ошибки и исправляет себя так, как мы раньше не видели».

Что нового по сравнению с Sonnet 4.5

1. Окно контекста 1 млн токенов (бета)

Окно контекста расширено с 200K до 1 миллиона токенов. Это означает, что целые кодовые базы, объемные юридические документы или многочасовые истории диалогов помещаются в один промпт.

Новая функция context compaction (также в бета-версии) автоматически суммирует старые сегменты разговора, эффективно расширяя полезный контекст еще больше.

2. Улучшенное следование инструкциям, меньше галлюцинаций

Это то, что разработчики заметили в первую очередь. При тестировании Claude Code:

70% предпочли Sonnet 4.6 модели Sonnet 4.5
59% предпочли её даже модели Opus 4.5 (флагманской модели ноября 2025 года)

Упомянутые конкретные улучшения:

Читает существующий код перед его изменением (вместо того чтобы гадать)
Объединяет логику вместо её дублирования
Меньше ложных заявлений об успехе («Я исправил баг», когда это не так)
Меньше избыточного проектирования — не добавляет ненужных абстракций
Лучшее доведение многоэтапных задач до конца

Сооснователь Cursor назвал это «заметным улучшением по сравнению с Sonnet 4.5 по всем направлениям, включая долгосрочные задачи и более сложные проблемы». GitHub сообщил о «высоких показателях решения задач и той согласованности, которая необходима разработчикам» при сложных исправлениях в нескольких репозиториях.

3. Использование компьютера готово к продакшену

Прыжок с 61.4% до 72.5% в OSWorld преодолевает важный порог. Пользователи описывают «способности человеческого уровня в таких задачах, как навигация по сложным электронным таблицам или заполнение многоэтапных веб-форм».

Sonnet 4.6 также значительно улучшила устойчивость к инъекциям промптов (prompt injection) при использовании компьютера, достигнув уровня Opus 4.6. Это критически важно для любого агента, который просматривает веб-страницы или обрабатывает непроверенные входные данные.

4. Extended Thinking + Adaptive Thinking

Обе функции поддерживаются, позволяя модели выделять больше вычислительных ресурсов для решения сложных задач. Но примечательно, что Sonnet 4.6 показывает отличные результаты даже без включенного Extended Thinking — базовая модель стала фундаментально лучше.

5. Обновление бесплатного тарифа

Пользователи бесплатной версии Claude теперь получают Sonnet 4.6 по умолчанию, а также:

Возможность создания файлов

Коннекторы (интеграция с внешними данными)

Навыки (многоразовые инструкции)

Context compaction

На данный момент это самый мощный бесплатный уровень ИИ среди всех крупных провайдеров.

6. MCP-коннекторы в Excel

Claude в Excel теперь поддерживает коннекторы для S&P Global, LSEG, Daloopa, PitchBook, Moody's и FactSet, позволяя загружать актуальные финансовые данные прямо в таблицы.

Цены

Цена не изменилась по сравнению с Sonnet 4.5:

Тариф	Цена
claude.ai Free	$0 (Sonnet 4.6 по умолчанию, лимиты использования)
claude.ai Pro	$20/мес (более высокие лимиты, доступ к Opus)
API input	$3 за миллион токенов
API output	$15 за миллион токенов

Для сравнения:

Opus 4.6 API: $15/$75 за миллион токенов (в 5 раз дороже)

GPT-5.2 API: $5/$15 за миллион токенов (в 1.7 раза дороже за вход)

Gemini 3 Pro API: $7/$21 за миллион токенов (в 2.3 раза дороже за вход)

Стоимость сессии Claude Code

Для типичной сессии кодинга (100K входных + 20K выходных токенов):

Модель	Стоимость сессии
Sonnet 4.6	$0.60
GPT-5.2	$0.80
Opus 4.6	$3.00

Команда, запускающая 100 агентских сессий в день, экономит около $240 в день, используя Sonnet 4.6 вместо Opus.

Как получить доступ

claude.ai

Уже установлена по умолчанию. Откройте claude.ai — вы используете Sonnet 4.6.

Claude Code

bash

claude  # Sonnet 4.6 теперь используется по умолчанию
claude --model claude-sonnet-4-6-20250217  # явный выбор модели

API

ID модели: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Облачные платформы

Доступна на Amazon Bedrock и Google Cloud Vertex AI с первого дня.

Контекст индустрии

Sonnet 4.6 — это второй крупный релиз Anthropic за 11 дней (после Opus 4.6 от 6 февраля). CNBC назвала этот темп «продолжением бешеной скорости выпуска моделей ИИ». VentureBeat охарактеризовал это как «событие, вызвавшее сейсмический сдвиг в ценообразовании для ИИ-индустрии».

Общий тренд таков: нижний порог производительности растет. То, для чего шесть месяцев назад требовалась флагманская модель за $15/$75, теперь работает за $3/$15. Для создателей ИИ-продуктов это означает:

Запуск ИИ-функций стал в 5 раз дешевле
Агенты, использующие компьютер, стали экономически выгодными в масштабе
Модель больше не является узким местом — всё дело в реализации

Создаете продукты с Claude Sonnet 4.6? Y Build интегрируется с Claude Code для разработки с помощью ИИ, а затем берет на себя деплой, создание демо-роликов Demo Cut, AI SEO и аналитику — полный цикл от кода до роста. Начните бесплатно.

Источники: