Cada palabra que genera ChatGPT tiene un costo, pero desde que salió este modelo, el precio por cada palabra o token ha ido bajando constantemente, y lo mismo sucede con sus competidores. Hoy en día existen modelos de inteligencia artificial que no solo son más potentes, sino también más económicos que nunca. Sin embargo, lo curioso es que, a pesar de esa caída en costos, estamos pagando cada vez más por usarlos. ¿Por qué sucede esto?
Primero, es importante entender qué son los tokens. OpenAI los describe como “secuencias comunes de caracteres en un texto”. Son la unidad básica que los modelos usan para entender lo que escribimos y para generar sus respuestas. Al usar ChatGPT, enviamos tokens de entrada (nuestros textos) y recibimos tokens de salida (las respuestas del chatbot).
El costo por millón de tokens varía según el modelo y entre tokens de entrada y salida. Por ejemplo, generar texto (tokens de salida) suele ser mucho más caro que procesar lo que escribimos (tokens de entrada). A continuación, algunos precios aproximados de modelos actuales:
- GPT-5: $1.10 por millón de tokens de entrada y $10 por millón de tokens de salida. - GPT-4o: $2.50 entrada y $10 salida. - Modelos como Gemini 2.5 Pro y Claude también están en rangos similares, con costos que pueden variar según la cantidad de tokens usados.
Aunque los costos por token han bajado notablemente desde la aparición de ChatGPT basado en GPT-3.5, debido a mejoras en eficiencia y hardware más rentable, muchos desarrolladores notan que sus facturas por usar IA son cada vez más caras. Esto se debe a que los modelos que realizan procesos de razonamiento consumen muchísimos tokens. A diferencia de los modelos que generan respuestas simples y rápidas, los que analizan, comparan opciones y “piensan” más en profundidad requieren procesar y generar múltiples tokens, lo que incrementa considerablemente el costo.
Un ejemplo claro de esto son las plataformas de "vibe coding", que permiten programar casi sin saber código, pero que dependen en gran medida de los modelos de IA para generar mucho texto. En estos casos, el consumo y costo de tokens, especialmente de salida, se dispara. Empresas y usuarios han comentado en foros y redes sociales lo complicado que es mantener estos servicios rentables debido a los elevados gastos.
Además, se espera que los agentes de IA, sistemas que pueden hacer tareas complejas por nosotros, también sean muy caros porque necesitarán procesar y generar enormes cantidades de tokens para razonar y actuar de manera efectiva.
Para reducir costos, una solución es utilizar modelos de IA que no “razonen” tanto, es decir, aquellos que no hacen un procesamiento tan profundo y generan texto de forma más directa. Estos son mucho más baratos y sirven para muchos casos de uso. Afortunadamente, ya existen modelos eficientes que combinan razonamiento y bajo costo, como DeepSeek R1.
Por último, OpenAI implementó en GPT-5 un mecanismo conocido como "enrutador", que analiza cada petición y decide automáticamente cuál versión del modelo usar, generalmente optando por la opción más económica posible. Esto ayuda a controlar el gasto tanto para la empresa como para los usuarios, que no consumen recursos innecesarios en consultas que no requieren un procesamiento tan complejo.
En resumen, aunque el coste por token baja constantemente, el uso intensivo de modelos más avanzados y que realizan procesos complejos hace que los gastos totales sigan aumentando. Por eso, entender cómo funcionan y elegir el modelo adecuado es clave para manejar mejor el presupuesto al usar IA.



