OpenAI libera modelos abiertos GPT-OSS 120B y 20B para uso local

OpenAI lanza dos LLMs open source con pesos completos: gpt-oss-120B (117B parámetros, MoE, 128K tokens, rendimiento top en una GPU) y gpt-oss-20B (21B, móvil/laptop, baja latencia). Avance clave en IA local, personalizable y privada. https://tinyurl.com/hkcek7h6

M
MIIA
editorial
5 de agosto de 2025·4 min de lectura
OpenAI libera modelos abiertos GPT-OSS 120B y 20B para uso local

OpenAI acaba de sacudir el mundo de la inteligencia artificial con un anuncio histórico: por primera vez desde el lanzamiento de GPT-2 en 2019, la compañía presenta no uno, sino dos modelos de lenguaje de código abierto con pesos completos. Se trata de gpt-oss-120b y gpt-oss-20b, modelos que cualquiera puede descargar, examinar, ajustar y ejecutar en su propio equipo. Este lanzamiento no solo cambia el panorama de la IA, sino que marca el inicio de una nueva era de transparencia, personalización y potencia computacional accesible para investigadores, desarrolladores y entusiastas en todo el mundo.

¿Por qué es tan importante esta novedad? Durante años, OpenAI ha sido conocida tanto por la impresionante capacidad de sus modelos como por su enfoque restrictivo en cuanto a la propiedad intelectual. Eso cambió el 5 de agosto de 2025, cuando estos nuevos modelos se lanzaron bajo la licencia Apache 2.0, lo que permite su uso comercial y experimental sin limitaciones. La gran diferencia está en que, en lugar de depender exclusivamente de APIs en la nube, ahora cualquiera puede estudiar estos modelos de primera mano o utilizarlos directamente en dispositivos locales, en empresas o incluso en dispositivos de consumo.

Conoce los modelos: maravillas técnicas con potencia real **gpt-oss-120B** - Tamaño: 117 mil millones de parámetros, con 5.1 mil millones activos por token gracias a la tecnología Mixture-of-Experts (MoE). - Rendimiento: Comparable o superior al modelo o4-mini de OpenAI en benchmarks reales. - Hardware: Funciona en una sola GPU de gama alta, como una Nvidia H100 o tarjetas con 80 GB de memoria. No requiere un centro de datos completo. - Capacidades: Incluye razonamiento en cadena y funciones avanzadas para automatización de investigaciones, redacción técnica, generación de código y más. - Personalización: Permite ajustar el “esfuerzo de razonamiento” en niveles bajo, medio o alto, para ahorrar recursos o maximizar potencia según se necesite. - Contexto: Puede procesar hasta 128,000 tokens, lo suficientemente extenso como para analizar libros enteros. - Fine-tuning: Diseñado para personalización sencilla y uso local o privado, sin límites de velocidad, total privacidad de datos y control absoluto sobre su despliegue.

**gpt-oss-20B** - Tamaño: 21 mil millones de parámetros, con 3.6 mil millones activos por token, también con arquitectura Mixture-of-Experts. - Rendimiento: Se sitúa entre los modelos o3-mini y o4-mini, ofreciendo un rendimiento sobresaliente entre los modelos “pequeños”. - Hardware: Funciona en laptops comunes, con apenas 16 GB de RAM o equivalente, siendo el modelo abierto más potente que puede funcionar en un teléfono o ordenador local. - Optimización móvil: Pensado para ofrecer IA privada y de baja latencia en smartphones (incluyendo soporte para Qualcomm Snapdragon), dispositivos en el borde (edge) y cualquier escenario que requiera inferencia local sin conexión a la nube. - Capacidades: Al igual que su hermano mayor, puede usar APIs, generar salidas estructuradas y ejecutar código Python cuando se le solicita.

Detalles técnicos: Mixture-of-Experts y quantización MXFP4 Ambos modelos emplean una arquitectura Mixture-of-Experts que activa solo unas pocas subredes especializadas por token, lo que permite tener un enorme número de parámetros pero con un uso de memoria moderado y velocidades de inferencia muy rápidas. Además, incluyen la quantización nativa MXFP4, que reduce el tamaño del modelo sin sacrificar precisión. Así, el gpt-oss-120B puede caber cómodamente en una sola GPU avanzada, mientras que el gpt-oss-20B corre sin problemas en laptops, PCs y dispositivos móviles.

Impacto real: herramientas para empresas, desarrolladores y aficionados - Para empresas: despliegue local para garantizar privacidad y cumplimiento normativo; sectores como finanzas, salud y legal pueden controlar completamente sus flujos de trabajo de lenguaje. - Para desarrolladores: libertad total para experimentar, ajustar y ampliar sin límites de API ni costes de servicios en la nube; control completo sobre latencia y gasto. - Para la comunidad: los modelos ya están disponibles en plataformas como Hugging Face y Ollama, listos para descargar e implementar en cuestión de minutos.

¿Cómo se comparan estos modelos? La gran noticia es que gpt-oss-120B es el primer modelo abierto con pesos completos que iguala el rendimiento de los mejores modelos comerciales como o4-mini. Por su parte, la versión de 20B cierra la brecha para la IA local, abriendo el camino a una rápida innovación y expansión de lo que es posible con modelos de lenguaje grandes ejecutados en dispositivos personales.

El futuro vuelve a ser abierto GPT-OSS de OpenAI no es solo un lanzamiento, sino una invitación a toda una comunidad de creadores, investigadores y empresas para no solo usar estos modelos, sino construir sobre ellos, iterar y evolucionar juntos hacia nuevas fronteras en inteligencia artificial.

fuente original
https://www.marktechpost.com/2025/08/05/openai-just-released-the-hottest-open-weight-llms-gpt-oss-120b-runs-on-a-high-end-laptop-and-gpt-oss-20b-runs-on-a-phone/
Prueba MIIA

Agentes de IA para WhatsApp, Instagram y Messenger. Configurados en 10 minutos.

Seguir leyendo

relacionado con #openai · #modelos de lenguaje · #código abierto
Prueba MIIA gratis →
WhatsApp