OpenAI ChatGPT Agent: Autonomía para tareas complejas y ejecución avanzada

El 17 de julio de 2025, OpenAI presentó ChatGPT Agent, una evolución que transforma a ChatGPT de ser solo un asistente conversacional a un agente de inteligencia artificial capaz de ejecutar de forma autónoma tareas complejas y de varios pasos, como navegar por internet o ejecutar código, dentro de un entorno virtual. Este avance combina dos herramientas previas: Operator, que permitía interacciones limitadas en la web como hacer clic, desplazarse o completar formularios; y Deep Research, que realizaba navegación autónoma y sintetizaba informes a lo largo de períodos más extensos. Mientras que Operator tenía capacidades de interacción pero no de análisis profundo, y Deep Research podía analizar información pero no interactuar dinámicamente, ChatGPT Agent unifica ambas funciones para integrar navegación, uso de herramientas y razonamiento en un solo agente. El núcleo de ChatGPT Agent es un entorno virtual que incluye un navegador visual para sitios web tradicionales, un navegador de texto optimizado para razonamiento estructurado, un terminal para ejecutar código y conectores API para servicios como Gmail o GitHub. El agente decide constantemente qué acciones realizar —ya sea hacer clic, ejecutar scripts o analizar contenido— manteniendo el estado entre las diferentes herramientas. Todo sucede dentro de un contexto controlado, asegurando trazabilidad y flexibilidad. Este agente puede encargarse de tareas como revisar tu calendario, buscar noticias relacionadas y resumir próximas reuniones; hacer compras ordenando ingredientes y comparando precios; realizar análisis de competencia tomando datos de sitios rivales y creando presentaciones o hojas de cálculo; o modelar finanzas descargando datos y actualizando documentos manteniendo el formato original. Estos flujos combinan la interacción con sitios, ejecución de scripts y generación de resultados editables, todo con supervisión del usuario. En cuanto a su desempeño, OpenAI reporta mejoras importantes en varias pruebas: 41.6% de éxito en el test Humanity’s Last Exam (llegando hasta 44.4% con pruebas paralelas), 27.4% de precisión en problemas matemáticos usando terminal y código, 45.5% en edición de hojas de cálculo, superando modelos previos y acercándose nivel humano. Además, en labores internas relacionadas con conocimiento, el agente iguala o supera expertos en la mitad de los casos, y establece nuevos récords en tareas de navegación con un 68.9% de aciertos. Esto evidencia un salto notable en autonomía y capacidad. Para minimizar riesgos, OpenAI ha implementado medidas como confirmación explícita antes de acciones críticas (compras, publicaciones), un “modo vigilancia” para tareas sensibles, defensa contra ataques de inyección de comandos, mecanismos de privacidad que no almacenan información sensible y controles adicionales para riesgos biológicos. Estas protecciones buscan evitar mal uso, desde fugas de datos hasta manipulaciones. ChatGPT Agent está disponible desde ya para usuarios Pro, Plus y Team: los usuarios Pro tienen acceso inmediato con 400 mensajes en modo agente al mes, mientras que Plus y Team obtendrán acceso progresivo con 40 mensajes mensuales. Las versiones Enterprise y Educación estarán disponibles en las próximas semanas. También se está ampliando el lanzamiento a regiones fuera de EE. UU., como Europa y Suiza. La activación se realiza desde el menú de herramientas en cualquier conversación, donde puedes describir la tarea deseada y seguir el progreso en tiempo real, con opción a pausar o tomar el control cuando quieras. Este lanzamiento marca un cambio importante en el uso de la inteligencia artificial, que pasa de responder consultas a actuar como un trabajador digital proactivo. Al combinar razonamiento avanzado, orquestación de herramientas y ejecución con conservación del contexto, OpenAI ofrece casos de uso más autónomos y orientados a la acción. Para desarrolladores y científicos de datos, ChatGPT Agent se convierte en una plataforma programable que puede extraer, procesar, sintetizar y exportar información bajo demanda, abriendo paso a nuevas formas de trabajo en investigación, automatización de negocios y productividad personal. En resumen, ChatGPT Agent representa un giro estratégico que lleva a los modelos de lenguaje de ser simples asistentes pasivos a agentes activos capaces de investigar, crear y ejecutar tareas en un entorno unificado y controlado. Se espera que esta tecnología evolucione hasta convertirse en una base fundamental para múltiples ámbitos potenciados con inteligencia artificial.