Cuando Anthropic saca un Opus nuevo, lo pruebo por curiosidad. Cuando saca un Sonnet nuevo, lo pruebo porque es el que termino usando para casi todo. Esa es la diferencia. Opus es el cerebro que sacas para los problemas difíciles; Sonnet es el caballo de batalla que corre el día a día sin quemarte la cuenta. Y Sonnet 5, que salió hoy, mueve la pelota justo donde más importa: precio contra rendimiento.
La frase con la que Anthropic lo presenta es "el Sonnet más agéntico hasta ahora". Suena a marketing, pero cuando miras los números tiene sentido. Te explico por qué esto es relevante para alguien que de verdad paga la cuenta a fin de mes.
Lo que cambia: rinde como Opus, cuesta como Sonnet
El titular es ese. Sonnet 5 se acerca peligrosamente a Opus 4.8 en las tareas que importan, pero por mucho menos plata.
Mira el benchmark de coding agéntico, SWE-bench Pro, que mide qué tan bien resuelve tareas de programación encadenadas (leer el repo, entender el problema, escribir el fix, correr los tests). Sonnet 5 marca 63.2 por ciento. Opus 4.8 está en 69.2 y el Sonnet anterior, el 4.6, estaba en 58.1. O sea, recortó la mitad de la distancia que había con Opus en una sola versión. Y en GDPval-AA v2, un benchmark de trabajo de conocimiento, incluso le gana raspando a Opus: 1618 contra 1615. No es que sea mejor que Opus en todo, pero para un montón de trabajo real ya juegan en la misma cancha.
Cuánto cuesta y la letra chica del tokenizer
Acá está la parte que de verdad cambia el negocio. El precio de lanzamiento, vigente hasta el 31 de agosto de 2026, es de dos dólares por millón de tokens de entrada y diez por millón de salida. Después sube a tres y quince, que es lo mismo que cobraba Sonnet 4.6. Para que dimensiones: Opus 4.8 cuesta cinco y veinticinco. Estás hablando de la mitad o menos del costo de Opus para un rendimiento muy parecido.
Ojo con esto, que la prensa lo pasa por encima: Sonnet 5 usa un tokenizer nuevo. ¿Qué significa? Que el mismo texto que antes contaba, digamos, 1.000 tokens, ahora puede contar hasta 1.350. El precio por token bajó, pero la cantidad de tokens que consume el mismo trabajo subió un poco. Por eso Anthropic dice que el precio de lanzamiento está "calibrado para quedar parejo en costo" durante la transición. Traducción: no asumas que tu factura baja a la mitad solo porque el precio por token bajó. Mide tu caso real antes de celebrar.
Para mí esto es clave en productos como Aigastos, donde proceso miles de recibos al mes. Un cambio de tokenizer no es un detalle: cambia cuántos tokens consume cada recibo y por lo tanto el costo total. Antes de migrar un flujo de producción completo, corro una muestra y comparo la factura real, no el precio de la tabla.
Por qué "el más agéntico" importa para un dev
Cuando Anthropic dice que es el Sonnet más agéntico, se refiere a que es mejor armando un plan y ejecutándolo solo: usar el navegador, correr comandos en la terminal, encadenar pasos sin que tú lo estés guiando a cada rato.
En la práctica, esto es lo que hace que un agente sea usable o no. Si le pides "revisa estos 40 archivos y aplica este cambio" y a la mitad se le pierde el hilo, no sirve. Sonnet 5 aguanta mejor esas cadenas largas. Y como es barato, ahora puedes dejarlo corriendo tareas que antes no te atrevías a darle a Opus porque el costo se disparaba. Esa es la jugada: no es solo que sea mejor, es que su precio te deja usarlo para cosas que antes eran impagables con el modelo top.
Tiene además un contexto de 1 millón de tokens, así que le puedes pasar una base de código entera o un montón de documentación de una sola vez sin tener que andar cortando en pedazos.
Dónde está disponible
Esta es otra señal de hacia dónde va la cosa: Sonnet 5 es el modelo por defecto en los planes Free y Pro. O sea, si usas Claude sin pagar o con el plan básico, ya estás usando Sonnet 5 sin hacer nada. También está disponible en Max, Team y Enterprise, en Claude Code y en la API.
En la API el modelo es claude-sonnet-5. Si trabajas por código, cambias el ID en tu request y listo, el formato es el mismo. Lo único que conviene revisar antes de migrar en serio es el conteo de tokens por lo del tokenizer nuevo.
¿Sonnet 5 u Opus 4.8? Cómo lo decido yo
No es que uno reemplace al otro. Es elegir la herramienta según la tarea.
Voy con Sonnet 5 para el 80 por ciento del trabajo: generar componentes, escribir y arreglar código de clientes, procesar datos, correr agentes en producción, tareas con muchos pasos pero bien definidas. Acá el ahorro de plata es la diferencia entre que un producto sea rentable o no.
Saco a Opus 4.8 cuando el problema es genuinamente difícil: una decisión de arquitectura que va a vivir años, un bug raro que ningún enfoque obvio resuelve, un refactor grande donde un error sutil cuesta caro. Ahí los puntos extra de rendimiento valen el precio.
Para un freelance esto es plata directa. Si todo tu trabajo lo corres en el modelo más caro "por si acaso", estás quemando margen. Sonnet 5 te deja bajar el costo base sin que se note en la calidad del resultado para la mayoría de las tareas.
Lo que no esperaría
Que sea mágico. Sigue siendo un Sonnet: en los problemas más duros Opus le gana, y para eso está Opus. La noticia real no es "el mejor modelo del mundo", es "casi tan bueno como el caro, por la mitad". En un negocio donde el costo de IA escala con el uso, ese "casi" multiplicado por miles de llamadas al mes es justo lo que decide si un producto se sostiene.
Mi recomendación: si corres algo en producción con la API, prueba mover una parte a claude-sonnet-5, pero mide la factura real con tu propio tráfico antes de migrar todo, por el tema del tokenizer. Y si usas claude.ai o Claude Code, ya lo tienes activo, así que simplemente úsalo y fíjate si notas alguna diferencia. Lo más probable es que no la notes, y ese es exactamente el punto.
Si recién partes con IA en tu flujo
Si estás recién viendo cómo meter IA en tu trabajo de desarrollo o en tu negocio, tengo un par de artículos que te sirven de punto de partida: cómo uso IA para desarrollar páginas web más rápido, donde explico mi flujo concreto, y las herramientas de IA que uso en 2026, que va al detalle de cada una. Y si quieres comparar con el hermano grande, mira lo que escribí sobre Claude Opus 4.8.