Claude Sonnet 4.6: IA de nível Opus pelo preço do Sonnet

TL;DR

A Anthropic lançou o Claude Sonnet 4.6 em 17 de fevereiro de 2026. O que você precisa saber:

79.6% no SWE-bench — quase idêntico ao Opus 4.6 (80.8%) em codificação do mundo real
72.5% no OSWorld — essencialmente empatado com o Opus 4.6 (72.7%) em computer use, quase o dobro do GPT-5.2 (38.2%)
$3/$15 por milhão de tokens — inalterado em relação ao Sonnet 4.5, 5x mais barato que o Opus
Janela de contexto de 1M de tokens (beta) — acima dos 200K anteriores
Agora é o modelo padrão para todos os usuários Free e Pro do Claude

Os desenvolvedores preferiram o Sonnet 4.6 em vez do Sonnet 4.5 70% das vezes no Claude Code, e até o preferiram em relação ao Opus 4.5 59% das vezes.

O que a Anthropic Anunciou

O Claude Sonnet 4.6 é o segundo grande lançamento de modelo da Anthropic em menos de duas semanas (seguindo o Opus 4.6 em 6 de fevereiro). Em seu post no blog, a Anthropic o descreve como "uma atualização completa das habilidades do modelo em codificação, computer use, raciocínio de longo contexto, planejamento de agentes, trabalho de conhecimento e design."

A afirmação central: "O desempenho que anteriormente exigiria o uso de um modelo da classe Opus — incluindo tarefas de escritório do mundo real e economicamente valiosas — agora está disponível com o Sonnet 4.6."

Esta é uma declaração significativa. A Anthropic está efetivamente dizendo: para a maioria das cargas de trabalho em produção, você não precisa mais pagar pelo Opus.

Análise Completa de Benchmarks

Onde o Sonnet 4.6 se iguala ou supera o Opus

Benchmark	O que testa	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	Codificação no mundo real	79.6%	80.8%	80.0%
OSWorld-Verified	Computer use	72.5%	72.7%	38.2%
GDPval-AA (Elo)	Tarefas de escritório	1633	1606	1462
Finance Agent v1.1	Análise financeira	63.3%	60.1%	59.0%
OfficeQA	Compreensão de documentos	Iguala o Opus	—	—

O Sonnet 4.6 na verdade lidera em tarefas de escritório e análise financeira — duas categorias economicamente significativas.

Onde o Opus 4.6 mantém a liderança

Benchmark	O que testa	Opus 4.6	Sonnet 4.6	Diferença
Terminal-Bench 2.0	Codificação agentica via terminal	65.4%	59.1%	6.3%
BrowseComp	Busca web agentica	84.0%	74.7%	9.3%
ARC-AGI-2	Resolução de problemas inéditos	68.8%	58.3%	10.5%
GPQA Diamond	Raciocínio de nível de pós-graduação	91.3%	89.9%	1.4%
MRCR v2 (8-needle 1M)	Raciocínio de longo contexto	76.0%	—	—

O padrão é claro: o Opus vence em tarefas que exigem o raciocínio mais profundo e inovador — refatoração em escala de base de código, pesquisa em múltiplas etapas e problemas que o modelo nunca viu antes. O Sonnet vence em tarefas prontas para produção e sensíveis à velocidade.

Computer Use: A Melhoria de Destaque

Os números de computer use merecem atenção especial:

Modelo	Pontuação OSWorld	Cronograma
Sonnet 3.5 (Out 2024)	14.9%	Primeiro lançamento
Sonnet 4.5	61.4%	+46.5%
Sonnet 4.6	72.5%	+11.1%
Opus 4.6	72.7%	O teto
GPT-5.2	38.2%	Para comparação

Em 16 meses, o Sonnet foi de 14.9% para 72.5% em computer use — uma melhoria de 4.9x. Jamie Cuffe, CEO da Pace (uma empresa de tecnologia de seguros), relatou que o Sonnet 4.6 atingiu 94% em seu benchmark interno de computer use: "Ele raciocina através de falhas e se autocorrige de maneiras que não tínhamos visto antes."

O que há de novo vs. Sonnet 4.5

1. Janela de Contexto de 1M de Tokens (Beta)

A janela de contexto expande de 200K para 1 milhão de tokens. Isso significa que bases de código inteiras, documentos jurídicos extensos ou horas de histórico de conversas cabem em um único prompt.

Um novo recurso de context compaction (também em beta) resume automaticamente segmentos de conversas mais antigos, estendendo efetivamente o contexto utilizável ainda mais.

2. Melhor Seguimento de Instruções, Menos Alucinações

Isso foi o que os desenvolvedores notaram primeiro. Nos testes do Claude Code:

70% preferiram o Sonnet 4.6 ao Sonnet 4.5
59% o preferiram até mesmo ao Opus 4.5 (o modelo de fronteira de novembro de 2025)

Melhorias específicas citadas:

Lê o código existente antes de modificá-lo (em vez de adivinhar)
Consolida a lógica em vez de duplicá-la
Menos falsas alegações de sucesso ("Corrigi o bug" quando não corrigiu)
Menos over-engineering — não adiciona abstrações desnecessárias
Melhor acompanhamento em tarefas de múltiplas etapas

O cofundador do Cursor chamou isso de "uma melhoria notável em relação ao Sonnet 4.5 em todos os aspectos, incluindo tarefas de longo horizonte e problemas mais difíceis." O GitHub relatou "fortes taxas de resolução e o tipo de consistência que os desenvolvedores precisam" em correções complexas em várias bases de código.

3. Computer Use Pronto para Produção

O salto de 61.4% para 72.5% no OSWorld cruza um limiar. Os usuários descrevem "capacidade de nível humano em tarefas como navegar em planilhas complexas ou preencher formulários web de várias etapas."

O Sonnet 4.6 também melhorou significativamente na resistência a prompt injection para computer use — performando nos níveis do Opus 4.6. Isso é crítico para qualquer agente que navega na web ou processa entradas não confiáveis.

4. Extended Thinking + Adaptive Thinking

Ambos são suportados, permitindo que o modelo aloque mais computação para problemas difíceis. Mas, notavelmente, o Sonnet 4.6 apresenta um desempenho forte mesmo sem o extended thinking ativado — o modelo base é fundamentalmente melhor.

5. Upgrade no Nível Gratuito

Os usuários gratuitos do Claude agora recebem o Sonnet 4.6 por padrão, além de:

Capacidades de criação de arquivos

Conectores (integrações com dados externos)

Skills (instruções reutilizáveis)

Context compaction

Este é o nível de IA gratuito mais capaz disponível de qualquer grande provedor.

6. Conectores MCP no Excel

O Claude no Excel agora suporta conectores para S&P Global, LSEG, Daloopa, PitchBook, Moody's e FactSet — trazendo dados financeiros ao vivo diretamente para as planilhas.

Preços

Sem alteração de preço em relação ao Sonnet 4.5:

Plano	Preço
claude.ai Free	$0 (Sonnet 4.6 padrão, limites de uso)
claude.ai Pro	$20/mês (limites maiores, acesso ao Opus)
API input	$3 por milhão de tokens
API output	$15 por milhão de tokens

Para comparação:

API Opus 4.6: $15/$75 por milhão de tokens (5x mais)

API GPT-5.2: $5/$15 por milhão de tokens (1.7x mais na entrada)

API Gemini 3 Pro: $7/$21 por milhão de tokens (2.3x mais na entrada)

Custo Por Sessão do Claude Code

Para uma sessão de codificação típica (100K input + 20K output tokens):

Modelo	Custo por sessão
Sonnet 4.6	$0.60
GPT-5.2	$0.80
Opus 4.6	$3.00

Uma equipe que executa 100 sessões de agentes por dia economiza ~$240/dia ao usar o Sonnet 4.6 em vez do Opus.

Como Acessar

claude.ai

Já é o padrão. Abra claude.ai → você está usando o Sonnet 4.6.

Claude Code

bash

claude  # Sonnet 4.6 agora é o padrão
claude --model claude-sonnet-4-6-20250217  # seleção explícita

API

ID do Modelo: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Plataformas de Nuvem

Disponível no Amazon Bedrock e Google Cloud Vertex AI desde o primeiro dia.

Contexto da Indústria

O Sonnet 4.6 é o segundo grande lançamento da Anthropic em 11 dias (após o Opus 4.6 em 6 de fevereiro). A CNBC descreveu o ritmo como "continuando a velocidade vertiginosa de lançamentos de modelos de IA." A VentureBeat chamou isso de "um evento sísmico de reprecificação para a indústria de IA."

A tendência mais ampla: o piso de desempenho está subindo. O que exigia um modelo emblemático de $15/$75 há seis meses agora é entregue a $3/$15. Para construtores de produtos de IA, isso significa:

Recursos de IA custam 5x menos para rodar
Agentes de computer use são economicamente viáveis em escala
O modelo não é mais o gargalo — a entrega é

Construindo com o Claude Sonnet 4.6? O Y Build integra-se ao Claude Code para desenvolvimento assistido por IA, e então cuida do deployment, vídeos de produto Demo Cut, IA SEO e analytics — o stack completo do código ao crescimento. Comece gratuitamente.

Fontes: