Claude Sonnet 4.6: IA de nível Opus pelo preço do Sonnet
A Anthropic lançou o Claude Sonnet 4.6 em 17 de fevereiro de 2026 — entregando desempenho próximo ao Opus por 1/5 do custo. Análise completa das novidades, todas as pontuações de benchmark, preços, disponibilidade e por que os desenvolvedores o preferem 70% mais que o Sonnet 4.5.
TL;DR
A Anthropic lançou o Claude Sonnet 4.6 em 17 de fevereiro de 2026. O que você precisa saber:
- 79.6% no SWE-bench — quase idêntico ao Opus 4.6 (80.8%) em codificação do mundo real
- 72.5% no OSWorld — essencialmente empatado com o Opus 4.6 (72.7%) em computer use, quase o dobro do GPT-5.2 (38.2%)
- $3/$15 por milhão de tokens — inalterado em relação ao Sonnet 4.5, 5x mais barato que o Opus
- Janela de contexto de 1M de tokens (beta) — acima dos 200K anteriores
- Agora é o modelo padrão para todos os usuários Free e Pro do Claude
O que a Anthropic Anunciou
O Claude Sonnet 4.6 é o segundo grande lançamento de modelo da Anthropic em menos de duas semanas (seguindo o Opus 4.6 em 6 de fevereiro). Em seu post no blog, a Anthropic o descreve como "uma atualização completa das habilidades do modelo em codificação, computer use, raciocínio de longo contexto, planejamento de agentes, trabalho de conhecimento e design."
A afirmação central: "O desempenho que anteriormente exigiria o uso de um modelo da classe Opus — incluindo tarefas de escritório do mundo real e economicamente valiosas — agora está disponível com o Sonnet 4.6."
Esta é uma declaração significativa. A Anthropic está efetivamente dizendo: para a maioria das cargas de trabalho em produção, você não precisa mais pagar pelo Opus.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Análise Completa de Benchmarks
Onde o Sonnet 4.6 se iguala ou supera o Opus
| Benchmark | O que testa | Sonnet 4.6 | Opus 4.6 | GPT-5.2 |
|---|---|---|---|---|
| SWE-bench Verified | Codificação no mundo real | 79.6% | 80.8% | 80.0% |
| OSWorld-Verified | Computer use | 72.5% | 72.7% | 38.2% |
| GDPval-AA (Elo) | Tarefas de escritório | 1633 | 1606 | 1462 |
| Finance Agent v1.1 | Análise financeira | 63.3% | 60.1% | 59.0% |
| OfficeQA | Compreensão de documentos | Iguala o Opus | — | — |
O Sonnet 4.6 na verdade lidera em tarefas de escritório e análise financeira — duas categorias economicamente significativas.
Onde o Opus 4.6 mantém a liderança
| Benchmark | O que testa | Opus 4.6 | Sonnet 4.6 | Diferença |
|---|---|---|---|---|
| Terminal-Bench 2.0 | Codificação agentica via terminal | 65.4% | 59.1% | 6.3% |
| BrowseComp | Busca web agentica | 84.0% | 74.7% | 9.3% |
| ARC-AGI-2 | Resolução de problemas inéditos | 68.8% | 58.3% | 10.5% |
| GPQA Diamond | Raciocínio de nível de pós-graduação | 91.3% | 89.9% | 1.4% |
| MRCR v2 (8-needle 1M) | Raciocínio de longo contexto | 76.0% | — | — |
O padrão é claro: o Opus vence em tarefas que exigem o raciocínio mais profundo e inovador — refatoração em escala de base de código, pesquisa em múltiplas etapas e problemas que o modelo nunca viu antes. O Sonnet vence em tarefas prontas para produção e sensíveis à velocidade.
Computer Use: A Melhoria de Destaque
Os números de computer use merecem atenção especial:
| Modelo | Pontuação OSWorld | Cronograma |
|---|---|---|
| Sonnet 3.5 (Out 2024) | 14.9% | Primeiro lançamento |
| Sonnet 4.5 | 61.4% | +46.5% |
| Sonnet 4.6 | 72.5% | +11.1% |
| Opus 4.6 | 72.7% | O teto |
| GPT-5.2 | 38.2% | Para comparação |
Em 16 meses, o Sonnet foi de 14.9% para 72.5% em computer use — uma melhoria de 4.9x. Jamie Cuffe, CEO da Pace (uma empresa de tecnologia de seguros), relatou que o Sonnet 4.6 atingiu 94% em seu benchmark interno de computer use: "Ele raciocina através de falhas e se autocorrige de maneiras que não tínhamos visto antes."
O que há de novo vs. Sonnet 4.5
1. Janela de Contexto de 1M de Tokens (Beta)
A janela de contexto expande de 200K para 1 milhão de tokens. Isso significa que bases de código inteiras, documentos jurídicos extensos ou horas de histórico de conversas cabem em um único prompt.
Um novo recurso de context compaction (também em beta) resume automaticamente segmentos de conversas mais antigos, estendendo efetivamente o contexto utilizável ainda mais.
2. Melhor Seguimento de Instruções, Menos Alucinações
Isso foi o que os desenvolvedores notaram primeiro. Nos testes do Claude Code:
- 70% preferiram o Sonnet 4.6 ao Sonnet 4.5
- 59% o preferiram até mesmo ao Opus 4.5 (o modelo de fronteira de novembro de 2025)
- Lê o código existente antes de modificá-lo (em vez de adivinhar)
- Consolida a lógica em vez de duplicá-la
- Menos falsas alegações de sucesso ("Corrigi o bug" quando não corrigiu)
- Menos over-engineering — não adiciona abstrações desnecessárias
- Melhor acompanhamento em tarefas de múltiplas etapas
3. Computer Use Pronto para Produção
O salto de 61.4% para 72.5% no OSWorld cruza um limiar. Os usuários descrevem "capacidade de nível humano em tarefas como navegar em planilhas complexas ou preencher formulários web de várias etapas."
O Sonnet 4.6 também melhorou significativamente na resistência a prompt injection para computer use — performando nos níveis do Opus 4.6. Isso é crítico para qualquer agente que navega na web ou processa entradas não confiáveis.
4. Extended Thinking + Adaptive Thinking
Ambos são suportados, permitindo que o modelo aloque mais computação para problemas difíceis. Mas, notavelmente, o Sonnet 4.6 apresenta um desempenho forte mesmo sem o extended thinking ativado — o modelo base é fundamentalmente melhor.
5. Upgrade no Nível Gratuito
Os usuários gratuitos do Claude agora recebem o Sonnet 4.6 por padrão, além de:
- Capacidades de criação de arquivos
- Conectores (integrações com dados externos)
- Skills (instruções reutilizáveis)
- Context compaction
Este é o nível de IA gratuito mais capaz disponível de qualquer grande provedor.
6. Conectores MCP no Excel
O Claude no Excel agora suporta conectores para S&P Global, LSEG, Daloopa, PitchBook, Moody's e FactSet — trazendo dados financeiros ao vivo diretamente para as planilhas.
Preços
Sem alteração de preço em relação ao Sonnet 4.5:
| Plano | Preço |
|---|---|
| claude.ai Free | $0 (Sonnet 4.6 padrão, limites de uso) |
| claude.ai Pro | $20/mês (limites maiores, acesso ao Opus) |
| API input | $3 por milhão de tokens |
| API output | $15 por milhão de tokens |
Para comparação:
- API Opus 4.6: $15/$75 por milhão de tokens (5x mais)
- API GPT-5.2: $5/$15 por milhão de tokens (1.7x mais na entrada)
- API Gemini 3 Pro: $7/$21 por milhão de tokens (2.3x mais na entrada)
Custo Por Sessão do Claude Code
Para uma sessão de codificação típica (100K input + 20K output tokens):
| Modelo | Custo por sessão |
|---|---|
| Sonnet 4.6 | $0.60 |
| GPT-5.2 | $0.80 |
| Opus 4.6 | $3.00 |
Uma equipe que executa 100 sessões de agentes por dia economiza ~$240/dia ao usar o Sonnet 4.6 em vez do Opus.
Como Acessar
claude.ai
Já é o padrão. Abra claude.ai → você está usando o Sonnet 4.6.Claude Code
claude # Sonnet 4.6 agora é o padrão
claude --model claude-sonnet-4-6-20250217 # seleção explícita
API
ID do Modelo:claude-sonnet-4-6-20250217
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6-20250217",
max_tokens=4096,
messages=[{"role": "user", "content": "Your prompt here"}]
)
Plataformas de Nuvem
Disponível no Amazon Bedrock e Google Cloud Vertex AI desde o primeiro dia.Contexto da Indústria
O Sonnet 4.6 é o segundo grande lançamento da Anthropic em 11 dias (após o Opus 4.6 em 6 de fevereiro). A CNBC descreveu o ritmo como "continuando a velocidade vertiginosa de lançamentos de modelos de IA." A VentureBeat chamou isso de "um evento sísmico de reprecificação para a indústria de IA."
A tendência mais ampla: o piso de desempenho está subindo. O que exigia um modelo emblemático de $15/$75 há seis meses agora é entregue a $3/$15. Para construtores de produtos de IA, isso significa:
- Recursos de IA custam 5x menos para rodar
- Agentes de computer use são economicamente viáveis em escala
- O modelo não é mais o gargalo — a entrega é
Construindo com o Claude Sonnet 4.6? O Y Build integra-se ao Claude Code para desenvolvimento assistido por IA, e então cuida do deployment, vídeos de produto Demo Cut, IA SEO e analytics — o stack completo do código ao crescimento. Comece gratuitamente.
Fontes:
- Anthropic: Introducing Claude Sonnet 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship at one-fifth the cost
- 9to5Mac: Claude Sonnet 4.6 improved coding skills
- MacRumors: Claude Sonnet 4.6 improved coding, computer use
- MarkTechPost: Claude 4.6 Sonnet with 1M token context
- OfficeChai: Claude Sonnet 4.6 Benchmarks
- SiliconANGLE: Anthropic debuts Sonnet 4.6
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.