Claude Sonnet 4.6: IA de nivel Opus a precio de Sonnet

TL;DR

Anthropic lanzó Claude Sonnet 4.6 el 17 de febrero de 2026. La conclusión clave:

79.6% SWE-bench — casi idéntico a Opus 4.6 (80.8%) en programación del mundo real.
72.5% OSWorld — esencialmente empatado con Opus 4.6 (72.7%) en computer use, casi el doble que GPT-5.2 (38.2%).
$3/$15 por millón de tokens — sin cambios desde Sonnet 4.5, 5 veces más barato que Opus.
Ventana de contexto de 1M de tokens (beta) — frente a los 200K anteriores.
Ahora es el modelo predeterminado para todos los usuarios Free y Pro de Claude.

Los desarrolladores prefirieron Sonnet 4.6 sobre Sonnet 4.5 el 70% de las veces en Claude Code, e incluso lo prefirieron sobre Opus 4.5 el 59% de las veces.

Lo que Anthropic anunció

Claude Sonnet 4.6 es el segundo lanzamiento importante de modelos de Anthropic en menos de dos semanas (tras Opus 4.6 el 6 de febrero). En su entrada de blog, Anthropic lo describe como "una actualización completa de las habilidades del modelo en programación, computer use, razonamiento de contexto largo, planificación de agentes, trabajo de conocimiento y diseño".

La afirmación central: "El rendimiento que anteriormente habría requerido recurrir a un modelo de clase Opus —incluso en tareas de oficina del mundo real y económicamente valiosas— ya está disponible con Sonnet 4.6".

Esta es una declaración significativa. Anthropic está diciendo efectivamente: para la mayoría de las cargas de trabajo de producción, ya no es necesario pagar por Opus.

Desglose completo de benchmarks

Dónde Sonnet 4.6 iguala o supera a Opus

Benchmark	Qué evalúa	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	Programación del mundo real	79.6%	80.8%	80.0%
OSWorld-Verified	Uso de computadora (`computer use`)	72.5%	72.7%	38.2%
GDPval-AA (Elo)	Tareas de oficina	1633	1606	1462
Finance Agent v1.1	Análisis financiero	63.3%	60.1%	59.0%
OfficeQA	Comprensión de documentos	Iguala a Opus	—	—

Sonnet 4.6 de hecho lidera en tareas de oficina y análisis financiero, dos categorías económicamente significativas.

Dónde Opus 4.6 mantiene el liderazgo

Benchmark	Qué evalúa	Opus 4.6	Sonnet 4.6	Diferencia
Terminal-Bench 2.0	Programación en terminal mediante agentes	65.4%	59.1%	6.3%
BrowseComp	Búsqueda web mediante agentes	84.0%	74.7%	9.3%
ARC-AGI-2	Resolución de problemas novedosos	68.8%	58.3%	10.5%
GPQA Diamond	Razonamiento a nivel de posgrado	91.3%	89.9%	1.4%
MRCR v2 (8-needle 1M)	Razonamiento de contexto largo	76.0%	—	—

El patrón es claro: Opus gana en tareas que requieren el razonamiento más profundo y novedoso —refactorización de bases de código a gran escala, investigación de múltiples pasos y problemas que el modelo no ha visto antes—. Sonnet gana en tareas listas para producción y sensibles a la velocidad.

Computer Use: La mejora más destacada

Las cifras de computer use merecen atención especial:

Modelo	Puntuación OSWorld	Cronología
Sonnet 3.5 (Oct 2024)	14.9%	Lanzamiento inicial
Sonnet 4.5	61.4%	+46.5%
Sonnet 4.6	72.5%	+11.1%
Opus 4.6	72.7%	El techo
GPT-5.2	38.2%	Para comparación

En 16 meses, Sonnet pasó del 14.9% al 72.5% en computer use —una mejora de 4.9x. Jamie Cuffe, CEO de Pace (una empresa de tecnología de seguros), informó que Sonnet 4.6 alcanzó el 94% en su benchmark interno de computer use: "Razona a través de los fallos y se autocorrige de formas que no habíamos visto antes".

Novedades frente a Sonnet 4.5

1. Ventana de contexto de 1M de tokens (Beta)

La ventana de contexto se expande de 200K a 1 millón de tokens. Esto significa que bases de código completas, documentos legales extensos o horas de historial de conversación caben en un solo prompt.

Una nueva función de compactación de contexto (context compaction, también en beta) resume automáticamente los segmentos más antiguos de la conversación, extendiendo de manera efectiva el contexto utilizable aún más.

2. Mejor seguimiento de instrucciones, menos alucinaciones

Esto es lo primero que notaron los desarrolladores. En las pruebas de Claude Code:

El 70% prefirió Sonnet 4.6 sobre Sonnet 4.5.
El 59% lo prefirió incluso sobre Opus 4.5 (el modelo de frontera de noviembre de 2025).

Mejoras específicas citadas:

Lee el código existente antes de modificarlo (en lugar de adivinar).
Consolida la lógica en lugar de duplicarla.
Menos afirmaciones falsas de éxito ("He corregido el error" cuando no es así).
Menos sobreingeniería — no añade abstracciones innecesarias.
Mejor seguimiento en tareas de múltiples pasos.

El cofundador de Cursor lo llamó "una mejora notable sobre Sonnet 4.5 en todos los aspectos, incluyendo tareas de largo horizonte y problemas más difíciles". GitHub informó "fuertes tasas de resolución y el tipo de consistencia que los desarrolladores necesitan" en correcciones complejas a través de múltiples bases de código.

3. Computer Use ya está listo para producción

El salto del 61.4% al 72.5% en OSWorld cruza un umbral. Los usuarios describen "capacidad de nivel humano en tareas como navegar por hojas de cálculo complejas o completar formularios web de varios pasos".

Sonnet 4.6 también mejoró significativamente en la resistencia a la inyección de prompts para computer use, rindiendo a niveles de Opus 4.6. Esto es crítico para cualquier agente que navegue por la web o procese entradas no confiables.

4. Extended Thinking + Adaptive Thinking

Ambos son compatibles, permitiendo al modelo asignar más cómputo a problemas difíciles. Pero, sobre todo, Sonnet 4.6 rinde con fuerza incluso sin extended thinking habilitado —el modelo base es fundamentalmente mejor.

5. Actualización del nivel gratuito

Los usuarios gratuitos de Claude ahora tienen Sonnet 4.6 por defecto, además de:

Capacidades de creación de archivos.

Connectors (integraciones con datos externos).

Skills (instrucciones reutilizables).

Compactación de contexto (context compaction).

Este es el nivel de IA gratuito más capaz disponible de cualquier proveedor importante.

6. MCP Connectors en Excel

Claude en Excel ahora admite conectores para S&P Global, LSEG, Daloopa, PitchBook, Moody's y FactSet, extrayendo datos financieros en vivo directamente a las hojas de cálculo.

Precios

Sin cambios de precio respecto a Sonnet 4.5:

Plan	Precio
claude.ai Free	$0 (Sonnet 4.6 por defecto, límites de uso)
claude.ai Pro	$20/mes (límites más altos, acceso a Opus)
API input	$3 por millón de tokens
API output	$15 por millón de tokens

Para comparar:

API de Opus 4.6: $15/$75 por millón de tokens (5 veces más).

API de GPT-5.2: $5/$15 por millón de tokens (1.7 veces más en input).

API de Gemini 3 Pro: $7/$21 por millón de tokens (2.3 veces más en input).

Costo por sesión de Claude Code

Para una sesión de programación típica (100K tokens de input + 20K tokens de output):

Modelo	Costo por sesión
Sonnet 4.6	$0.60
GPT-5.2	$0.80
Opus 4.6	$3.00

Un equipo que ejecuta 100 sesiones de agentes al día ahorra ~$240/día al usar Sonnet 4.6 en lugar de Opus.

Cómo acceder

claude.ai

Ya es el predeterminado. Abre claude.ai → estás usando Sonnet 4.6.

Claude Code

bash

claude  # Sonnet 4.6 es ahora el predeterminado
claude --model claude-sonnet-4-6-20250217  # selección explícita

API

ID del modelo: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

Plataformas en la nube

Disponible en Amazon Bedrock y Google Cloud Vertex AI desde el primer día.

Contexto de la industria

Sonnet 4.6 es el segundo lanzamiento importante de Anthropic en 11 días (después de Opus 4.6 el 6 de febrero). CNBC describió el ritmo como "la continuación de la velocidad vertiginosa de los lanzamientos de modelos de IA". VentureBeat lo llamó "un evento sísmico de ajuste de precios para la industria de la IA".

La tendencia general: el suelo del rendimiento está subiendo. Lo que requería un modelo insignia de $15/$75 hace seis meses, ahora se ofrece a $3/$15. Para los creadores de productos de IA, esto significa:

Las funciones de IA cuestan 5 veces menos de ejecutar.
Los agentes de computer use son económicamente viables a escala.
El modelo ya no es el cuello de botella — el despliegue sí lo es.

¿Estás construyendo con Claude Sonnet 4.6? Y Build se integra con Claude Code para el desarrollo asistido por IA, y luego se encarga del despliegue, videos de producto con Demo Cut, SEO con IA y analíticas — el stack completo desde el código hasta el crecimiento. Empieza gratis.

Fuentes: