Claude Sonnet 4.6: IA de nivel Opus a precio de Sonnet
Anthropic lanzó Claude Sonnet 4.6 el 17 de febrero de 2026, ofreciendo un rendimiento cercano a Opus a 1/5 del costo. Desglose completo de las novedades, todas las puntuaciones de benchmarks, precios, disponibilidad y por qué los desarrolladores lo prefieren un 70% por encima de Sonnet 4.5.
TL;DR
Anthropic lanzó Claude Sonnet 4.6 el 17 de febrero de 2026. La conclusión clave:
- 79.6% SWE-bench — casi idéntico a Opus 4.6 (80.8%) en programación del mundo real.
- 72.5% OSWorld — esencialmente empatado con Opus 4.6 (72.7%) en
computer use, casi el doble que GPT-5.2 (38.2%). - $3/$15 por millón de tokens — sin cambios desde Sonnet 4.5, 5 veces más barato que Opus.
- Ventana de contexto de 1M de tokens (beta) — frente a los 200K anteriores.
- Ahora es el modelo predeterminado para todos los usuarios Free y Pro de Claude.
Lo que Anthropic anunció
Claude Sonnet 4.6 es el segundo lanzamiento importante de modelos de Anthropic en menos de dos semanas (tras Opus 4.6 el 6 de febrero). En su entrada de blog, Anthropic lo describe como "una actualización completa de las habilidades del modelo en programación, computer use, razonamiento de contexto largo, planificación de agentes, trabajo de conocimiento y diseño".
La afirmación central: "El rendimiento que anteriormente habría requerido recurrir a un modelo de clase Opus —incluso en tareas de oficina del mundo real y económicamente valiosas— ya está disponible con Sonnet 4.6".
Esta es una declaración significativa. Anthropic está diciendo efectivamente: para la mayoría de las cargas de trabajo de producción, ya no es necesario pagar por Opus.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Desglose completo de benchmarks
Dónde Sonnet 4.6 iguala o supera a Opus
| Benchmark | Qué evalúa | Sonnet 4.6 | Opus 4.6 | GPT-5.2 |
|---|---|---|---|---|
| SWE-bench Verified | Programación del mundo real | 79.6% | 80.8% | 80.0% |
| OSWorld-Verified | Uso de computadora (computer use) | 72.5% | 72.7% | 38.2% |
| GDPval-AA (Elo) | Tareas de oficina | 1633 | 1606 | 1462 |
| Finance Agent v1.1 | Análisis financiero | 63.3% | 60.1% | 59.0% |
| OfficeQA | Comprensión de documentos | Iguala a Opus | — | — |
Sonnet 4.6 de hecho lidera en tareas de oficina y análisis financiero, dos categorías económicamente significativas.
Dónde Opus 4.6 mantiene el liderazgo
| Benchmark | Qué evalúa | Opus 4.6 | Sonnet 4.6 | Diferencia |
|---|---|---|---|---|
| Terminal-Bench 2.0 | Programación en terminal mediante agentes | 65.4% | 59.1% | 6.3% |
| BrowseComp | Búsqueda web mediante agentes | 84.0% | 74.7% | 9.3% |
| ARC-AGI-2 | Resolución de problemas novedosos | 68.8% | 58.3% | 10.5% |
| GPQA Diamond | Razonamiento a nivel de posgrado | 91.3% | 89.9% | 1.4% |
| MRCR v2 (8-needle 1M) | Razonamiento de contexto largo | 76.0% | — | — |
El patrón es claro: Opus gana en tareas que requieren el razonamiento más profundo y novedoso —refactorización de bases de código a gran escala, investigación de múltiples pasos y problemas que el modelo no ha visto antes—. Sonnet gana en tareas listas para producción y sensibles a la velocidad.
Computer Use: La mejora más destacada
Las cifras de computer use merecen atención especial:
| Modelo | Puntuación OSWorld | Cronología |
|---|---|---|
| Sonnet 3.5 (Oct 2024) | 14.9% | Lanzamiento inicial |
| Sonnet 4.5 | 61.4% | +46.5% |
| Sonnet 4.6 | 72.5% | +11.1% |
| Opus 4.6 | 72.7% | El techo |
| GPT-5.2 | 38.2% | Para comparación |
En 16 meses, Sonnet pasó del 14.9% al 72.5% en computer use —una mejora de 4.9x. Jamie Cuffe, CEO de Pace (una empresa de tecnología de seguros), informó que Sonnet 4.6 alcanzó el 94% en su benchmark interno de computer use: "Razona a través de los fallos y se autocorrige de formas que no habíamos visto antes".
Novedades frente a Sonnet 4.5
1. Ventana de contexto de 1M de tokens (Beta)
La ventana de contexto se expande de 200K a 1 millón de tokens. Esto significa que bases de código completas, documentos legales extensos o horas de historial de conversación caben en un solo prompt.
Una nueva función de compactación de contexto (context compaction, también en beta) resume automáticamente los segmentos más antiguos de la conversación, extendiendo de manera efectiva el contexto utilizable aún más.
2. Mejor seguimiento de instrucciones, menos alucinaciones
Esto es lo primero que notaron los desarrolladores. En las pruebas de Claude Code:
- El 70% prefirió Sonnet 4.6 sobre Sonnet 4.5.
- El 59% lo prefirió incluso sobre Opus 4.5 (el modelo de frontera de noviembre de 2025).
- Lee el código existente antes de modificarlo (en lugar de adivinar).
- Consolida la lógica en lugar de duplicarla.
- Menos afirmaciones falsas de éxito ("He corregido el error" cuando no es así).
- Menos sobreingeniería — no añade abstracciones innecesarias.
- Mejor seguimiento en tareas de múltiples pasos.
3. Computer Use ya está listo para producción
El salto del 61.4% al 72.5% en OSWorld cruza un umbral. Los usuarios describen "capacidad de nivel humano en tareas como navegar por hojas de cálculo complejas o completar formularios web de varios pasos".
Sonnet 4.6 también mejoró significativamente en la resistencia a la inyección de prompts para computer use, rindiendo a niveles de Opus 4.6. Esto es crítico para cualquier agente que navegue por la web o procese entradas no confiables.
4. Extended Thinking + Adaptive Thinking
Ambos son compatibles, permitiendo al modelo asignar más cómputo a problemas difíciles. Pero, sobre todo, Sonnet 4.6 rinde con fuerza incluso sin extended thinking habilitado —el modelo base es fundamentalmente mejor.
5. Actualización del nivel gratuito
Los usuarios gratuitos de Claude ahora tienen Sonnet 4.6 por defecto, además de:
- Capacidades de creación de archivos.
- Connectors (integraciones con datos externos).
- Skills (instrucciones reutilizables).
- Compactación de contexto (
context compaction).
Este es el nivel de IA gratuito más capaz disponible de cualquier proveedor importante.
6. MCP Connectors en Excel
Claude en Excel ahora admite conectores para S&P Global, LSEG, Daloopa, PitchBook, Moody's y FactSet, extrayendo datos financieros en vivo directamente a las hojas de cálculo.
Precios
Sin cambios de precio respecto a Sonnet 4.5:
| Plan | Precio |
|---|---|
| claude.ai Free | $0 (Sonnet 4.6 por defecto, límites de uso) |
| claude.ai Pro | $20/mes (límites más altos, acceso a Opus) |
| API input | $3 por millón de tokens |
| API output | $15 por millón de tokens |
Para comparar:
- API de Opus 4.6: $15/$75 por millón de tokens (5 veces más).
- API de GPT-5.2: $5/$15 por millón de tokens (1.7 veces más en input).
- API de Gemini 3 Pro: $7/$21 por millón de tokens (2.3 veces más en input).
Costo por sesión de Claude Code
Para una sesión de programación típica (100K tokens de input + 20K tokens de output):
| Modelo | Costo por sesión |
|---|---|
| Sonnet 4.6 | $0.60 |
| GPT-5.2 | $0.80 |
| Opus 4.6 | $3.00 |
Un equipo que ejecuta 100 sesiones de agentes al día ahorra ~$240/día al usar Sonnet 4.6 en lugar de Opus.
Cómo acceder
claude.ai
Ya es el predeterminado. Abre claude.ai → estás usando Sonnet 4.6.Claude Code
claude # Sonnet 4.6 es ahora el predeterminado
claude --model claude-sonnet-4-6-20250217 # selección explícita
API
ID del modelo:claude-sonnet-4-6-20250217
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6-20250217",
max_tokens=4096,
messages=[{"role": "user", "content": "Your prompt here"}]
)
Plataformas en la nube
Disponible en Amazon Bedrock y Google Cloud Vertex AI desde el primer día.Contexto de la industria
Sonnet 4.6 es el segundo lanzamiento importante de Anthropic en 11 días (después de Opus 4.6 el 6 de febrero). CNBC describió el ritmo como "la continuación de la velocidad vertiginosa de los lanzamientos de modelos de IA". VentureBeat lo llamó "un evento sísmico de ajuste de precios para la industria de la IA".
La tendencia general: el suelo del rendimiento está subiendo. Lo que requería un modelo insignia de $15/$75 hace seis meses, ahora se ofrece a $3/$15. Para los creadores de productos de IA, esto significa:
- Las funciones de IA cuestan 5 veces menos de ejecutar.
- Los agentes de
computer useson económicamente viables a escala. - El modelo ya no es el cuello de botella — el despliegue sí lo es.
¿Estás construyendo con Claude Sonnet 4.6? Y Build se integra con Claude Code para el desarrollo asistido por IA, y luego se encarga del despliegue, videos de producto con Demo Cut, SEO con IA y analíticas — el stack completo desde el código hasta el crecimiento. Empieza gratis.
Fuentes:
- Anthropic: Introducing Claude Sonnet 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship at one-fifth the cost
- 9to5Mac: Claude Sonnet 4.6 improved coding skills
- MacRumors: Claude Sonnet 4.6 improved coding, computer use
- MarkTechPost: Claude 4.6 Sonnet with 1M token context
- OfficeChai: Claude Sonnet 4.6 Benchmarks
- SiliconANGLE: Anthropic debuts Sonnet 4.6
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.