IA china lidera generación de imágenes con nuevo modelo avanzado

Tencent presenta Hunyuan Image 3.0, modelo open source de generación de imágenes por texto que supera en votación a ciegas a Google y OpenAI, usando difusión, codificadores multimodales y RLHF para mejorar calidad y eficiencia. https://tinyurl.com/36upur24

M
MIIA
editorial
6 de octubre de 2025·3 min de lectura
IA china lidera generación de imágenes con nuevo modelo avanzado

Tencent ha presentado su nuevo modelo de inteligencia artificial para generar imágenes a partir de descripciones de texto, y ha sorprendido al superar a competidores reconocidos como Google y OpenAI en diversas pruebas. El modelo, llamado Hunyuan Image 3.0, ha logrado posicionarse en el primer lugar según la clasificación de LMArena, dejando atrás a otros sistemas como Gemini 2.5 (conocido como nano banana), GPT-Image-1, Flux-1-Kontext-Max y Qwen-Image.

Esta evaluación se basa en una votación a ciegas, donde los usuarios seleccionan las imágenes que prefieren sin saber qué modelo las creó. Según estos resultados, Hunyuan Image 3.0 superó a todos sus rivales, incluido el popular nano banana de Google. Sin embargo, dado que el modelo lleva poco tiempo disponible, los expertos consideran estos resultados preliminares.

Tencent explica que su modelo utiliza una arquitectura de difusión innovadora, que combina dos codificadores: uno multimodal y otro especializado en el reconocimiento de caracteres de diferentes idiomas. Además, emplea un método de optimización basado en el aprendizaje por refuerzo con retroalimentación humana (RLHF) para mejorar la calidad de las imágenes. También han implementado un sistema de compresión que reduce el consumo de recursos sin perder calidad.

Hunyuan Image 3.0 está disponible en GitHub con una licencia bastante permisiva que incluso permite su uso comercial y profesional. Aunque se puede probar gratis en la web del proyecto, solo se ofrece un crédito inicial para crear una imagen. La adquisición de créditos tiene un costo: con 8 dólares mensuales se obtienen 500 créditos, lo que permitiría generar unas 50 imágenes a un costo aproximado de 0,16 dólares cada una. Comparado con nano banana, que cobra alrededor de 0,039 dólares por imagen, es una opción más cara. También es posible probar el modelo en plataformas como Hugging Face o a través de una clave API en Tencent Cloud para uso local.

En cuanto a otras herramientas del mercado, Gemini sigue destacando como un editor de imágenes, pues muchos usuarios prefieren cargar una foto y pedir cambios específicos mediante la IA, en lugar de crear imágenes desde cero. Aunque Hunyuan Image 3.0 ofrece demos con funciones similares, por ahora está más enfocada en generar una imagen a partir de un solo texto, más que en mantener un intercambio conversacional como sí lo permite Gemini. Alibaba, con su Qwen-Image-Editor, también sigue esa línea de interacción directa con la imagen, similar a la de Google y nano banana.

Lo relevante aquí es que la generación de imágenes, que parecía estar en manos exclusivas de modelos cerrados, ahora puede ser igual o incluso más efectiva con propuestas abiertas como Hunyuan Image 3.0. Esta apuesta por el software abierto destaca en el panorama chino y contrasta con la tendencia más cerrada de muchas compañías estadounidenses que desarrollan IA para imágenes, texto y video.

fuente original
https://www.xataka.com/robotica-e-ia/tenemos-nuevo-ganador-generacion-imagenes-ia-no-estadounidense-sino-chino
Prueba MIIA

Agentes de IA para WhatsApp, Instagram y Messenger. Configurados en 10 minutos.

Seguir leyendo

relacionado con #inteligencia artificial · #generación de imágenes · #tencent
Prueba MIIA gratis →
WhatsApp