Una startup china llamada Moonshot ha lanzado Kimi K2 Thinking, un modelo de inteligencia artificial abierto con un billón de parámetros que ha logrado algo sorprendente: superar a los mejores modelos propietarios de empresas como OpenAI, Google o Anthropic. Hasta ahora se pensaba que los modelos de código abierto no podrían competir con GPT-5, Gemini 2.5 Pro o Claude, pero esta nueva propuesta demuestra lo contrario.

Moonshot ya había presentado Kimi K2 en julio, destacando su enorme tamaño de un billón de parámetros. Ahora llega la versión "Thinking", que cuenta con 32.000 millones de parámetros activos y utiliza una arquitectura Mixture of Experts. Según sus creadores, este modelo puede mantener un uso estable de herramientas agénticas durante entre 200 y 300 llamadas secuenciales, lo que significa que puede ejecutar largas cadenas de acciones de manera autónoma y con muy pocos errores. Lo más importante es que, además de ser muy eficiente, supera a GPT-5 y Claude Sonnet 4.5 en varias pruebas, y su costo es mucho menor.

En cuanto a los benchmarks, Kimi K2 Thinking obtuvo las mejores puntuaciones en tests como Humanity's Last Exam (conocimientos generales, 44,9%) y BrowserComp (competencias en navegación agéntica, 60,2%). También se acerca mucho a Claude en el test de desarrollo de software SWE y destaca en LiveCodeBench v6. Aunque en algunos resultados sigue ligeramente detrás de ciertos modelos occidentales, el avance es impresionante.

Por otro lado, análisis independientes han evaluado su desempeño en tareas que simulan agentes de atención al cliente, donde Kimi K2 Thinking alcanzó un 93% del máximo, superando a competidores como GPT-5 Codex High, que obtuvo un 87%. Aún se esperan más pruebas, pero las perspectivas son muy prometedoras.

Además, su costo es significativamente menor. Entrenar este modelo costó alrededor de 4,6 millones de dólares, una cifra reducida comparada con los aproximadamente 500 millones de dólares estimados para GPT-5. Usar la API de Kimi K2 Thinking también es más económico, con tarifas de 0,6 dólares por millón de tokens de entrada y 2,5 dólares por millón de tokens de salida. En comparación, GPT-5 Chat cobra 1,25 y 10 dólares respectivamente, y Claude Sonnet 4.5 cuesta 3 y 15 dólares por millón de tokens.

En cuanto a su tecnología, Kimi K2 Thinking utiliza cuantización INT4 para mejorar su eficiencia sin perder precisión en las respuestas. Su ventana de contexto permite procesar hasta 256.000 tokens, una cifra modesta para modelos tan grandes, pero notable. Como modelo abierto, se puede descargar y usar localmente, aunque requiere una máquina potente, dado que pesa 594 GB. Por ejemplo, combinando dos Mac Studio M3 Ultra se consigue que funcione de forma relativamente fluida con una velocidad de unos 15 tokens por segundo.

Aunque Moonshot es una empresa independiente, detrás de esta startup está el respaldo financiero de Alibaba, que se está consolidando como una potencia en inteligencia artificial. Alibaba no solo desarrolla modelos propios sobresalientes, como Qwen, sino que también apoya proyectos externos como Kimi K2 Thinking.

En los últimos meses, China ha demostrado un dominio considerable en el desarrollo de modelos abiertos —no estrictamente de código abierto—, con propuestas cada vez más avanzadas que antes parecían quedar atrás frente a los mayores modelos propietarios de occidente. Este logro demuestra que esa brecha se está cerrando.

En definitiva, este avance representa un voto de confianza para los modelos abiertos provenientes de empresas chinas. Aunque su gran tamaño dificulta el uso práctico para usuarios comunes, ofrecen una alternativa muy interesante para empresas y proyectos que busquen soluciones eficientes, potentes y más accesibles económicamente. La competencia en el mundo de la inteligencia artificial se intensifica y estos modelos podrían cambiar muchas reglas del juego.

↗

fuente original

https://www.xataka.com/robotica-e-ia/creiamos-que-ningun-modelo-abierto-podria-superar-a-gpt-5-startup-china-demuestra-que-estabamos-equivocados

ver →

etiquetas:inteligencia artificial modelos de código abierto tecnología china moonshot kimi k2 thinking alibaba competencia en ia