En 2019, el investigador François Chollet creó un benchmark para la inteligencia artificial llamado ARC-AGI, una idea adelantada a su tiempo, ya que por entonces casi no había sistemas capaces de ponerlo a prueba. Este test se diferencia de otros porque no se enfoca en la capacidad de memorización, sino en la habilidad de la IA para pensar de forma abstracta y generalizar conocimientos.

Los desafíos de ARC-AGI, y su versión posterior ARC-AGI 2, consisten principalmente en resolver puzzles visuales que son sencillos para los humanos, pero que resultan muy complejos para las máquinas. Sin embargo, en los últimos años, los modelos de IA han ido mejorando en estas áreas, logrando resolver gradualmente más acertijos, aunque el coste para hacerlo era extremadamente alto.

Aquí es donde entra en juego GPT-5.2. El año pasado, un modelo llamado o3-preview logró resolver el 87% de los problemas de ARC-AGI 1, pero a un precio de casi medio millón de dólares, lo que significa que cada tarea costaba alrededor de 4,560 dólares.

Ahora, con la llegada de GPT-5.2, el panorama ha cambiado radicalmente. Esta nueva versión fue capaz de resolver el 90.5% de los problemas en ARC-AGI 1, pero pagando sólo 11.65 dólares por tarea, es decir, un costo 390 veces menor que hace un año. Incluso, una versión más económica de GPT-5.2 logró un 86.2% de aciertos con menos de un dólar por tarea, demostrando un avance impresionante en eficiencia.

En cuanto a ARC-AGI 2, que es aún más desafiante, la mayoría de los modelos apenas alcanzaban un 38% de resolución. GPT-5.2 ha dado un salto enorme al resolver casi el 55% de los problemas, también a un costo mucho más bajo: 15.72 dólares por tarea. Esto confirma una tendencia clara: las inteligencias artificiales no sólo mejoran en capacidad, sino que lo hacen gastando menos dinero.

Estos avances son muy positivos, porque aunque los incrementos en rendimiento parecen estar desacelerándose, la reducción de costos es cada vez más notable. Esto podría marcar un punto de inflexión en la carrera de la IA, donde la verdadera cuestión ya no es si una inteligencia artificial puede resolver un problema, sino cuánto costará hacerlo.

Además, esta mejora en eficiencia es especialmente importante para OpenAI, que enfrenta retos económicos. Con un crecimiento en rendimiento más moderado, lograr que sus modelos sean más baratos y eficientes es clave para su futuro. GPT-5.2 parece ser un paso claro en esa dirección, y también una respuesta a los avances de competidores como Gemini 3 Pro.

↗

fuente original

https://www.xataka.com/robotica-e-ia/gran-pregunta-que-afronta-gpt-5-2-no-mejor-peor-que-sus-antecesores-sale-barato

ver →

etiquetas:inteligencia artificial benchmark arc-agi gpt-5.2 openai resolver problemas visuales eficiencia en ia costo de modelos ia