Claude Opus 4.5: Avances en programación con desafíos persistentes en IA

Claude Opus 4.5 lidera en programación y tareas complejas con 80.9% en SWE-Bench, supera humanos en examen técnico, mejora eficiencia token y costos, e incorpora control de “esfuerzo” para optimizar recursos en IA avanzada. https://tinyurl.com/2uz82ubv

M
MIIA
editorial
25 de noviembre de 2025·4 min de lectura
Claude Opus 4.5: Avances en programación con desafíos persistentes en IA

Anthropic ha presentado Claude Opus 4.5, su modelo de inteligencia artificial más avanzado hasta ahora. La empresa asegura que es el mejor del mundo para programación, agentes inteligentes y tareas computacionales, superando a modelos como GPT-5.1 Codex-Max de OpenAI y Gemini 3 Pro de Google. Este lanzamiento llega pocos días después de la aparición de esas mismas versiones y de Grok 4.1.

En cuanto a desempeño, Claude Opus 4.5 alcanzó un 80,9% de precisión en SWE-Bench Verified, la prueba de referencia para evaluar habilidades en ingeniería de software. Además, Anthropic lo sometió a un difícil examen para contratar ingenieros, con un límite de dos horas, y el modelo superó a todos los candidatos humanos que participaron.

Este avance consolida a Anthropic como uno de los líderes en IA para programación. De hecho, Meta utiliza Claude para su asistente interno de código, llamado Devmate, aunque ambas compañías compiten en otros ámbitos.

Pero las mejoras no se quedan solo en la programación. Opus 4.5 también destaca en la creación de documentos, hojas de cálculo y presentaciones profesionales, realiza tareas de investigación profunda con diversas fuentes, tiene un razonamiento visual y matemático avanzado, y puede gestionar equipos de subagentes para sistemas multiagente complejos.

En cuanto a costos, Anthropic ha reducido significativamente el precio de su API, pasando de 15/75 dólares por millón de tokens de entrada/salida a 5/25 dólares. Además, el modelo es más eficiente que sus versiones anteriores: en un modo de esfuerzo medio iguala el rendimiento de Sonnet 4.5 consumiendo un 76% menos de tokens; en modo alto, lo supera por 4,3 puntos porcentuales usando un 48% menos de tokens.

La empresa ha incorporado un parámetro llamado “esfuerzo” (bajo, medio, alto) que permite a los desarrolladores decidir cuánto tiempo y cuántos tokens quiere que el modelo destine a resolver una tarea. Esta tendencia, orientada a mejorar la eficiencia sin perder calidad, también ha sido adoptada por OpenAI en sus últimos lanzamientos.

Además del nuevo modelo, Anthropic ha renovado su plataforma y sus aplicaciones de usuario. Por ejemplo, Claude Code ahora tiene un mejor modo de planificación que hace preguntas aclaratorias antes de generar un archivo editable con el plan de ejecución, similar a técnicas avanzadas vistas en investigaciones profundas. Claude for Chrome está disponible para usuarios Max (con precios entre 100 y 200 dólares al mes dependiendo de los límites) y permite a la IA manejar tareas en múltiples pestañas del navegador. También Claude for Excel se ha abierto a usuarios Max, Team y Enterprise con soporte para gráficos, tablas dinámicas y carga de archivos. Finalmente, las conversaciones prolongadas ya no se ven limitadas por la ventana de contexto gracias a resúmenes automáticos que prolongan la interacción.

Sin embargo, el principal inconveniente de Opus 4.5 y en general de Claude es su límite de uso. Incluso los suscriptores Pro y Max con el plan básico ven cómo sus tokens se agotan rápido, y el sistema tarda unas cinco horas en restablecer las cuotas desde el primer mensaje enviado. Opus, al ser el modelo más potente, consume las cuotas más rápido. Esto genera frustración en usuarios que pagan entre 20 y 100 dólares al mes, aunque la compañía ha incrementado un poco los límites para Max y Team Premium, la experiencia aún queda lejos de lo esperado en un servicio de esta categoría.

Con este lanzamiento, Anthropic recupera el equilibrio en su gama de modelos. Durante los últimos dos meses, Sonnet 4.5 había superado a la versión anterior de Opus 4.1, lo que hacía dudar de la conveniencia de usar el modelo más caro. Ahora cuentan con tres modelos bien diferenciados: Haiku, Sonnet y Opus, cada uno con un enfoque claro en coste, velocidad y capacidad.

De cara al futuro, Anthropic apuesta por posicionarse como la opción premium para profesionales del conocimiento y desarrolladores, compitiendo directamente con OpenAI y Google en áreas donde la precisión y fiabilidad son clave. Pero para lograrlo, deberá resolver el problema de los límites de uso, que podrían frustrar precisamente a quienes más necesitan aprovechar el potencial del modelo.

fuente original
https://www.xataka.com/robotica-e-ia/anthropic-presenta-claude-opus-4-5-seguramente-mejor-modelo-para-programar-sigue-teniendo-gran-problema
Prueba MIIA

Agentes de IA para WhatsApp, Instagram y Messenger. Configurados en 10 minutos.

Seguir leyendo

relacionado con #inteligencia artificial · #modelos de ia · #programación
Prueba MIIA gratis →
WhatsApp