Claude Opus 4.7: O Que Há de Novo, Benchmarks e Guia Completo (2026)
Claude Opus 4.7 chegou — 13% melhor em codificação, 3x mais capacidade de visão, novo nível de esforço xhigh. Benchmarks completos, preços e comparação com o GPT-5.4.
TL;DR
| Detalhe | Claude Opus 4.7 |
|---|---|
| Data de lançamento | 16 de abril de 2026 |
| ID do modelo | claude-opus-4-7 |
| Preço | $5/$25 por MTok (mesmo do Opus 4.6) |
| Janela de contexto | 1M tokens |
| Disponibilidade | API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
| Principal melhoria | 13% melhor em codificação, 3x visão, novos níveis de esforço |
| SWE-bench Verified | ~85-90% (acima de 80.8%) |
| Novo recurso Claude Code | /ultrareview — revisão de código multi-agente |
O Que Há de Novo no Claude Opus 4.7?
O Claude Opus 4.7 é o modelo de fronteira mais recente da Anthropic com disponibilidade geral, lançado em 16 de abril de 2026. É um upgrade incremental, mas significativo, em relação ao Opus 4.6, com os maiores ganhos em engenharia de software e visão.
Diferente do Claude Mythos Preview (que a Anthropic manteve restrito a parceiros de cibersegurança), o Opus 4.7 está disponível publicamente em todos os produtos e APIs do Claude.
Resultados de Benchmark
Engenharia de Software
| Benchmark | Opus 4.7 | Opus 4.6 | GPT-5.4 | Mythos Preview |
|---|---|---|---|---|
| SWE-bench Verified | ~85-90% | 80.8% | ~80% | 93.9% |
| SWE-bench Pro | ~45% | — | 57.7% | 77.8% |
| Terminal-Bench 2.0 | 65.4% | 66.5% | 75.1% | 82% |
| Codificação interna de 93 tarefas | +13% vs 4.6 | baseline | — | — |
| Rakuten-SWE-Bench | 3x mais resolvidos | baseline | — | — |
A maior melhoria ocorre em tarefas complexas e multi-arquivos. A Anthropic destaca especificamente os ganhos nas "tarefas mais difíceis" — aquelas que exigem a compreensão de múltiplos arquivos, refatoração complexa e verificação de resultados.
Outras Capacidades
| Área | Melhoria |
|---|---|
| Raciocínio de documentos | 21% menos erros |
| Automação de fábrica | Ganhos de desempenho de 10-15% |
| Visão | 3x mais resolução de imagem (até 2,576px / 3.75MP) |
| Contexto longo | Recuperação e raciocínio aprimorados em 1M de tokens |
| Otimização de MCP | 30% menos overhead de tokens vs Opus 4.5 |
Upgrade de Visão: 3x mais Resolução
O Opus 4.7 aceita imagens de até 2.576 pixels no lado maior (~3.75 megapixels) — mais de 3x a capacidade anterior. Isso é importante para:
- Diagramas técnicos — gráficos de arquitetura, esquemas de circuitos
- Estruturas químicas — diagramas moleculares com qualidade de publicação
- Capturas de tela densas — capturas de página inteira de código, dashboards, planilhas
- Mockups de design — designs de UI de alta fidelidade
Novo: Controle de Esforço com "xhigh"
O Opus 4.7 introduz um novo nível de esforço: xhigh — situado entre "high" e "max".
| Nível de Esforço | Caso de Uso | Uso de Tokens |
|---|---|---|
| low | Consultas simples, respostas rápidas | Mínimo |
| medium | Tarefas padrão | Normal |
| high | Raciocínio complexo | Elevado |
| xhigh | Tarefas difíceis de várias etapas | Alto |
| max | Problemas mais difíceis, qualidade máxima | Máximo |
O nível xhigh oferece mais profundidade de raciocínio do que o "high" sem o custo total de tokens do "max" — um meio-termo prático para cargas de trabalho de produção.
Budgets de Tarefas (Beta Público)
Junto com o controle de esforço, a Anthropic está introduzindo os task budgets (orçamentos de tarefas) — uma maneira de os desenvolvedores definirem um limite de gastos de tokens para operações de longa duração. Isso oferece controle de custos sem precisar gerenciar cada chamada de API individualmente.
Atualizações do Claude Code
/ultrareview — Revisão de Código Multi-Agente
O recurso principal do Claude Code é o /ultrareview — um sistema de revisão de código baseado em nuvem que utiliza múltiplos sub-agentes para analisar seu código:
- Fase de Detecção de Bugs: Cria de 5 a 20 sub-agentes que exploram caminhos diferentes de forma independente em sua base de código.
- Fase de Verificação: Sub-agentes separados verificam cada bug candidato, filtrando falsos positivos.
Modo Automático para Usuários Max
O modo automático — onde o Claude Code executa comandos e faz edições sem pedir confirmação — agora está disponível para assinantes Max.
Opus 4.7 vs GPT-5.4: Qual Você Deve Usar?
| Dimensão | Opus 4.7 | GPT-5.4 |
|---|---|---|
| Codificação complexa | Lidera (refatoração multi-arquivos) | Forte, mas atrás |
| Uso de computador | Não disponível | Lidera (75% OSWorld) |
| Contexto longo | 1M tokens, melhor raciocínio | 1.05M tokens |
| Visão | 3.75MP, diagramas técnicos | Boa, mas menor |
| Velocidade | Mais lento, mais minucioso | Execução mais rápida |
| Preço | $5/$25 por MTok | $2.50/$15 per MTok |
| Suporte MCP | Nativo, otimizado | Limitado |
Aviso de Uso de Tokens
O Opus 4.7 utiliza um tokenizador atualizado que processa texto de forma diferente. A mesma entrada pode resultar em 1.0–1.35x mais tokens, dependendo do conteúdo. Combinado com mais tokens de saída em níveis de esforço mais altos, seus custos podem aumentar, embora o preço por token não tenha mudado.
Se você estiver migrando do Opus 4.6, monitore seu uso de tokens nos primeiros dias.
Salvaguardas de Cibersegurança
Após a situação do Mythos Preview, a Anthropic integrou salvaguardas de cibersegurança diretamente no Opus 4.7:
- Detecção e bloqueio automático de solicitações de cibersegurança proibidas ou de alto risco.
- Programa de Verificação Cibernética para pesquisadores de segurança legítimos e pen testers.
- Intencionalmente menos capaz que o Mythos Preview em temas cibernéticos, permitindo que a Anthropic teste salvaguardas em um modelo menos potente primeiro.
Como Acessar
# API
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "content-type: application/json" \
-d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Hello"}]}'
# Claude Code
claude --model opus # o padrão é o opus mais recente
Também disponível no Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry desde o primeiro dia.
Perguntas Frequentes
Quanto custa o Claude Opus 4.7?
$5 por milhão de tokens de entrada e $25 por milhão de tokens de saída — o mesmo que o Opus 4.6. No entanto, o tokenizador atualizado pode resultar em 1.0-1.35x mais tokens para o mesmo conteúdo.
O Opus 4.7 é melhor que o GPT-5.4?
Para engenharia de software complexa e tarefas de codificação multi-arquivos, sim. Para uso de computador, automação de desktop e eficiência de custo, o GPT-5.4 é atualmente melhor. Eles se destacam em áreas diferentes.
O que é o comando /ultrareview no Claude Code?
É um sistema de revisão de código multi-agente que cria de 5 a 20 sub-agentes para encontrar bugs de forma independente em seu código e, em seguida, verifica cada descoberta para filtrar falsos positivos. Usuários Pro e Max recebem 3 ultrareviews gratuitas.
Como o Opus 4.7 se compara ao Claude Mythos Preview?
O Mythos Preview é significativamente mais capaz (93.9% vs ~85-90% no SWE-bench), mas não está disponível publicamente. O Opus 4.7 é o melhor modelo do Claude que você pode realmente usar.
Devo fazer o upgrade do Opus 4.6?
Sim, se você faz codificação complexa ou trabalha com imagens técnicas. A melhoria de 13% em codificação e a resolução de visão 3x maior são significativas. Apenas observe seu uso de tokens, pois o novo tokenizador pode aumentar os custos.
O que é o nível de esforço "xhigh"?
Uma nova configuração de esforço entre "high" e "max" que oferece mais profundidade de raciocínio sem o custo total de tokens do esforço máximo. É ideal para tarefas difíceis onde você deseja qualidade, mas precisa controlar os custos.
Resumo
O Opus 4.7 é um upgrade sólido, não uma revolução. Os ganhos em codificação são reais, a melhoria na visão é significativa e o /ultrareview é uma capacidade genuinamente nova. Mas a maior notícia talvez seja o que ele não é — não é o Mythos Preview. A lacuna entre os modelos públicos e privados da Anthropic está agora maior do que nunca.
Para desenvolvedores, o Opus 4.7 é o melhor modelo público do Claude disponível e uma escolha forte para trabalhos de engenharia complexos. Se você deseja criar produtos baseados em IA sem gerenciar modelos e infraestrutura, o Y Build cuida disso para você — pense nele como um agente de IA mobile-first que entrega produtos, sem necessidade de servidor ou terminal.