Corea del Sur está consolidándose rápidamente como un referente en innovación de grandes modelos de lenguaje (LLM, por sus siglas en inglés), gracias a inversiones estratégicas del gobierno, investigación corporativa y colaboraciones open source enfocadas en desarrollar modelos adaptados al procesamiento del idioma coreano y aplicaciones locales. Este enfoque permite reducir la dependencia de tecnologías extranjeras de inteligencia artificial, mejorar la privacidad de los datos y respaldar sectores clave como la salud, la educación y las telecomunicaciones.

En 2025, el Ministerio de Ciencia y TIC lanzó un programa con un presupuesto de 240 mil millones de wones, seleccionando cinco consorcios liderados por Naver Cloud, SK Telecom, Upstage, LG AI Research y NC AI para desarrollar grandes modelos de lenguaje soberanos capaces de operar sobre infraestructura local. Además, se avanzó en regulaciones, como las pautas del Ministerio de Seguridad Alimentaria y Medicamentos para aprobar inteligencia artificial generadora de texto con fines médicos, el primer marco de este tipo a nivel mundial.

En el ámbito empresarial y académico, SK Telecom presentó AX 3.1 Lite, un modelo con 7 mil millones de parámetros entrenado desde cero con 1.65 billones de tokens multilingües, con especial énfasis en el coreano. Este modelo alcanza cerca del 96% en pruebas de razonamiento en coreano (KMMLU2) y supera en entendimiento cultural (CLIcK3) a modelos más grandes, estando disponible de forma abierta para aplicaciones móviles y en dispositivos, por medio de Hugging Face.

Por su parte, Naver ha continuado su línea HyperClova con el lanzamiento en junio de 2025 de HyperClova X Think, que mejora capacidades de búsqueda y conversación específicas para el idioma coreano. La compañía Upstage presenta Solar Pro 2, el único modelo coreano en la lista Frontier LM Intelligence, que destaca por lograr una alta eficiencia al nivel de modelos internacionales mucho más grandes.

LG AI Research debutó con Exaone 4.0 en julio de 2025, un modelo de 30 mil millones de parámetros que compite con benchmarks globales. En el hospital de la Universidad Nacional de Seúl desarrollaron un modelo médico único en Corea, entrenado con 38 millones de registros clínicos anonimizados y que obtuvo un puntaje del 86.2% en el Examen de Licencia Médica Coreano, superando el promedio humano del 79.7%.

Otra colaboración relevante es la de Mathpresso y Upstage con MATH GPT, un modelo pequeño de 13 mil millones de parámetros que supera a GPT-4 en pruebas matemáticas, logrando una precisión de 0.488 frente a 0.425, utilizando significativamente menos recursos computacionales.

En cuanto a proyectos open source, Polyglot-Ko (con modelos que van de 1.3 a 12.8 mil millones de parámetros) y Gecko-7B se enfocan en entrenar continuamente con datos coreanos para manejar particularidades lingüísticas como el cambio de código dentro del idioma.

Técnicamente, los desarrolladores coreanos priorizan la eficiencia, optimizando la relación entre tokens y parámetros basándose en técnicas inspiradas en el escalado Chinchilla. Esto les permite que modelos de entre 7 y 30 mil millones de parámetros alcancen niveles comparables a los de modelos más grandes desarrollados en Occidente, incluso con recursos limitados. Además, las adaptaciones específicas para dominios puntuales, como la salud o las matemáticas, consiguen resultados superiores.

El progreso se mide con benchmarks como KMMLU2, CLIcK3 y la lista Frontier LM, confirmando que los modelos coreanos están a la par con los sistemas avanzados a nivel mundial.

De cara al mercado, se espera que la industria de grandes modelos de lenguaje en Corea del Sur crezca de 182.4 millones de dólares en 2024 a 1,278.3 millones en 2030, con una tasa anual compuesta del 39.4%. Este crecimiento estará impulsado sobre todo por chatbots, asistentes virtuales y herramientas de análisis de sentimientos. Las empresas de telecomunicaciones están integrando LLMs basados en edge computing para reducir la latencia y mejorar la seguridad de los datos, impulsado por iniciativas gubernamentales como la Superautopista de Infraestructura de IA.

Algunos modelos clave en Corea incluyen AX 3.1 Lite y AX 4.0 Lite de SK Telecom, orientados a aplicaciones móviles y soberanas; HyperClova X Think de Naver, con un enfoque en búsqueda y conversación en coreano; Solar Pro 2 de Upstage, reconocido por su eficiencia; MATH GPT con especialización en matemáticas; Exaone 4.0 de LG AI Research con capacidades multimodales; proyectos open source como Polyglot-Ko y Gecko-7B; y el primer modelo médico desarrollado por la Universidad Nacional de Seúl para apoyo clínico.

Estos avances reflejan el compromiso de Corea del Sur por crear modelos de inteligencia artificial eficientes, relevantes culturalmente y que refuercen su posición en el escenario tecnológico global.

↗

fuente original

https://www.marktechpost.com/2025/08/21/meet-south-koreas-llm-powerhouses-hyperclova-ax-solar-pro-and-more/

ver →

etiquetas:inteligencia artificial modelos de lenguaje corea del sur innovación tecnológica modelos open source industria de ia aplicaciones médicas y culturales