Claude Sonnet 4.6: ИИ уровня Opus по цене Sonnet
Anthropic выпустила Claude Sonnet 4.6 17 февраля 2026 года — модель обеспечивает производительность, близкую к Opus, при стоимости в 5 раз ниже. Полный разбор новинок, результаты всех бенчмарков, цены, доступность и причины, по которым разработчики предпочитают её модели Sonnet 4.5 в 70% случаев.
TL;DR
Anthropic выпустила Claude Sonnet 4.6 17 февраля 2026 года. Основные выводы:
- 79.6% SWE-bench — практически идентично Opus 4.6 (80.8%) в реальном написании кода
- 72.5% OSWorld — фактически на одном уровне с Opus 4.6 (72.7%) в использовании компьютера, почти в два раза выше GPT-5.2 (38.2%)
- $3/$15 за миллион токенов — цена не изменилась по сравнению с Sonnet 4.5, что в 5 раз дешевле Opus
- Окно контекста 1M токенов (бета) — увеличено с 200K
- Теперь это модель по умолчанию для всех пользователей Free и Pro версий Claude
Что анонсировала Anthropic
Claude Sonnet 4.6 — это второй крупный релиз модели от Anthropic менее чем за две недели (после Opus 4.6 от 6 февраля). В своем блоге Anthropic описывает её как «полное обновление навыков модели в области кодинга, использования компьютера, рассуждений с длинным контекстом, планирования агентов, интеллектуальной работы и дизайна».
Ключевое утверждение: «Производительность, для которой раньше требовалась модель класса Opus — в том числе в реальных, экономически значимых офисных задачах — теперь доступна в Sonnet 4.6».
Это серьезное заявление. Anthropic фактически говорит: для большинства рабочих задач в продакшене вам больше не нужно платить за Opus.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Полный разбор бенчмарков
Где Sonnet 4.6 догоняет или опережает Opus
| Бенчмарк | Что тестирует | Sonnet 4.6 | Opus 4.6 | GPT-5.2 |
|---|---|---|---|---|
| SWE-bench Verified | Написание кода в реальных условиях | 79.6% | 80.8% | 80.0% |
| OSWorld-Verified | Использование компьютера | 72.5% | 72.7% | 38.2% |
| GDPval-AA (Elo) | Офисные задачи | 1633 | 1606 | 1462 |
| Finance Agent v1.1 | Финансовый анализ | 63.3% | 60.1% | 59.0% |
| OfficeQA | Понимание документов | На уровне Opus | — | — |
Sonnet 4.6 фактически лидирует в офисных задачах и финансовом анализе — двух экономически значимых категориях.
Где Opus 4.6 сохраняет лидерство
| Бенчмарк | Что тестирует | Opus 4.6 | Sonnet 4.6 | Разрыв |
|---|---|---|---|---|
| Terminal-Bench 2.0 | Агентное написание кода в терминале | 65.4% | 59.1% | 6.3% |
| BrowseComp | Агентный поиск в вебе | 84.0% | 74.7% | 9.3% |
| ARC-AGI-2 | Решение новых задач | 68.8% | 58.3% | 10.5% |
| GPQA Diamond | Рассуждения на уровне выпускника вуза | 91.3% | 89.9% | 1.4% |
| MRCR v2 (8-needle 1M) | Рассуждения с длинным контекстом | 76.0% | — | — |
Закономерность очевидна: Opus побеждает в задачах, требующих наиболее глубоких и нестандартных рассуждений — рефакторинг кодовой базы целиком, многоэтапные исследования и задачи, с которыми модель не сталкивалась ранее. Sonnet побеждает в задачах, готовых к использованию в продакшене, где важна скорость.
Использование компьютера: заметный прорыв
Показатели использования компьютера (computer use) заслуживают особого внимания:
| Модель | Результат OSWorld | Хронология |
|---|---|---|
| Sonnet 3.5 (Октябрь 2024) | 14.9% | Первый запуск |
| Sonnet 4.5 | 61.4% | +46.5% |
| Sonnet 4.6 | 72.5% | +11.1% |
| Opus 4.6 | 72.7% | Потолок |
| GPT-5.2 | 38.2% | Для сравнения |
За 16 месяцев Sonnet прошла путь от 14.9% до 72.5% в использовании компьютера — это улучшение в 4.9 раза. Джейми Кафф, CEO Pace (компания в сфере страховых технологий), сообщил, что Sonnet 4.6 набрала 94% в их внутреннем бенчмарке использования компьютера: «Она анализирует ошибки и исправляет себя так, как мы раньше не видели».
Что нового по сравнению с Sonnet 4.5
1. Окно контекста 1 млн токенов (бета)
Окно контекста расширено с 200K до 1 миллиона токенов. Это означает, что целые кодовые базы, объемные юридические документы или многочасовые истории диалогов помещаются в один промпт.
Новая функция context compaction (также в бета-версии) автоматически суммирует старые сегменты разговора, эффективно расширяя полезный контекст еще больше.
2. Улучшенное следование инструкциям, меньше галлюцинаций
Это то, что разработчики заметили в первую очередь. При тестировании Claude Code:
- 70% предпочли Sonnet 4.6 модели Sonnet 4.5
- 59% предпочли её даже модели Opus 4.5 (флагманской модели ноября 2025 года)
- Читает существующий код перед его изменением (вместо того чтобы гадать)
- Объединяет логику вместо её дублирования
- Меньше ложных заявлений об успехе («Я исправил баг», когда это не так)
- Меньше избыточного проектирования — не добавляет ненужных абстракций
- Лучшее доведение многоэтапных задач до конца
3. Использование компьютера готово к продакшену
Прыжок с 61.4% до 72.5% в OSWorld преодолевает важный порог. Пользователи описывают «способности человеческого уровня в таких задачах, как навигация по сложным электронным таблицам или заполнение многоэтапных веб-форм».
Sonnet 4.6 также значительно улучшила устойчивость к инъекциям промптов (prompt injection) при использовании компьютера, достигнув уровня Opus 4.6. Это критически важно для любого агента, который просматривает веб-страницы или обрабатывает непроверенные входные данные.
4. Extended Thinking + Adaptive Thinking
Обе функции поддерживаются, позволяя модели выделять больше вычислительных ресурсов для решения сложных задач. Но примечательно, что Sonnet 4.6 показывает отличные результаты даже без включенного Extended Thinking — базовая модель стала фундаментально лучше.
5. Обновление бесплатного тарифа
Пользователи бесплатной версии Claude теперь получают Sonnet 4.6 по умолчанию, а также:
- Возможность создания файлов
- Коннекторы (интеграция с внешними данными)
- Навыки (многоразовые инструкции)
- Context compaction
На данный момент это самый мощный бесплатный уровень ИИ среди всех крупных провайдеров.
6. MCP-коннекторы в Excel
Claude в Excel теперь поддерживает коннекторы для S&P Global, LSEG, Daloopa, PitchBook, Moody's и FactSet, позволяя загружать актуальные финансовые данные прямо в таблицы.
Цены
Цена не изменилась по сравнению с Sonnet 4.5:
| Тариф | Цена |
|---|---|
| claude.ai Free | $0 (Sonnet 4.6 по умолчанию, лимиты использования) |
| claude.ai Pro | $20/мес (более высокие лимиты, доступ к Opus) |
| API input | $3 за миллион токенов |
| API output | $15 за миллион токенов |
Для сравнения:
- Opus 4.6 API: $15/$75 за миллион токенов (в 5 раз дороже)
- GPT-5.2 API: $5/$15 за миллион токенов (в 1.7 раза дороже за вход)
- Gemini 3 Pro API: $7/$21 за миллион токенов (в 2.3 раза дороже за вход)
Стоимость сессии Claude Code
Для типичной сессии кодинга (100K входных + 20K выходных токенов):
| Модель | Стоимость сессии |
|---|---|
| Sonnet 4.6 | $0.60 |
| GPT-5.2 | $0.80 |
| Opus 4.6 | $3.00 |
Команда, запускающая 100 агентских сессий в день, экономит около $240 в день, используя Sonnet 4.6 вместо Opus.
Как получить доступ
claude.ai
Уже установлена по умолчанию. Откройте claude.ai — вы используете Sonnet 4.6.Claude Code
claude # Sonnet 4.6 теперь используется по умолчанию
claude --model claude-sonnet-4-6-20250217 # явный выбор модели
API
ID модели:claude-sonnet-4-6-20250217
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6-20250217",
max_tokens=4096,
messages=[{"role": "user", "content": "Your prompt here"}]
)
Облачные платформы
Доступна на Amazon Bedrock и Google Cloud Vertex AI с первого дня.Контекст индустрии
Sonnet 4.6 — это второй крупный релиз Anthropic за 11 дней (после Opus 4.6 от 6 февраля). CNBC назвала этот темп «продолжением бешеной скорости выпуска моделей ИИ». VentureBeat охарактеризовал это как «событие, вызвавшее сейсмический сдвиг в ценообразовании для ИИ-индустрии».
Общий тренд таков: нижний порог производительности растет. То, для чего шесть месяцев назад требовалась флагманская модель за $15/$75, теперь работает за $3/$15. Для создателей ИИ-продуктов это означает:
- Запуск ИИ-функций стал в 5 раз дешевле
- Агенты, использующие компьютер, стали экономически выгодными в масштабе
- Модель больше не является узким местом — всё дело в реализации
Создаете продукты с Claude Sonnet 4.6? Y Build интегрируется с Claude Code для разработки с помощью ИИ, а затем берет на себя деплой, создание демо-роликов Demo Cut, AI SEO и аналитику — полный цикл от кода до роста. Начните бесплатно.
Источники:
- Anthropic: Introducing Claude Sonnet 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship at one-fifth the cost
- 9to5Mac: Claude Sonnet 4.6 improved coding skills
- MacRumors: Claude Sonnet 4.6 improved coding, computer use
- MarkTechPost: Claude 4.6 Sonnet with 1M token context
- OfficeChai: Claude Sonnet 4.6 Benchmarks
- SiliconANGLE: Anthropic debuts Sonnet 4.6
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.