El 17 de julio de 2025, OpenAI presentó ChatGPT Agent, transformando a ChatGPT de un simple asistente conversacional en un agente de IA capaz de realizar de forma autónoma tareas complejas y con múltiples pasos, desde navegar por internet hasta ejecutar código en un entorno virtual.

Este nuevo agente combina las funcionalidades de dos herramientas anteriores de OpenAI: Operator, que permitía interacciones limitadas en la web como hacer clic, desplazarse y completar formularios, y Deep Research, que ofrecía navegación autónoma y síntesis de informes a largo plazo. Mientras que Operator podía interactuar pero no hacer análisis profundos, y Deep Research podía analizar pero no actuar dinámicamente en sitios web, ChatGPT Agent reúne lo mejor de ambos, integrando navegación, uso de herramientas y razonamiento en una sola arquitectura.

El núcleo del sistema es un entorno virtual que incluye un navegador visual para sitios habituales, un navegador de texto optimizado para razonamiento estructurado, un terminal para ejecutar código y conectores API para servicios como Gmail o GitHub. El agente decide en tiempo real cuándo hacer clic, ejecutar scripts o procesar información, manteniendo el estado entre estas herramientas dentro de un contexto controlado que garantiza trazabilidad y flexibilidad.

Con ChatGPT Agent se pueden realizar tareas como revisar tu calendario, buscar noticias relevantes y resumir próximas reuniones; hacer la compra comparando precios y realizando pedidos; analizar la competencia extrayendo datos y preparando presentaciones o hojas de cálculo; o modelar finanzas descargando datos y actualizando documentos manteniendo su formato. Estas actividades combinan varios modos de herramientas, desde iniciar sesión en sitios hasta ejecutar código y generar resultados editables, siempre bajo tu supervisión.

En cuanto a rendimiento, OpenAI reporta avances notables en varios benchmarks. Por ejemplo, obtuvo un 41.6% de aciertos en el examen Humanity’s Last Exam, alcanzando hasta 44.4% con intentos paralelos; un 27.4% de precisión en FrontierMath usando soporte de terminal y código; y un 45.5% en SpreadsheetBench al editar archivos XLSX, superando ampliamente modelos previos. En tareas internas de conocimiento, el agente iguala o supera el desempeño de expertos en cerca del 50% de los casos, y en pruebas de navegación web ofrece resultados líderes con un 68.9%.

Para garantizar la seguridad, se han implementado varias medidas: confirmación explícita antes de acciones delicadas como compras o publicaciones; un “modo vigilancia” para tareas sensibles que requieren supervisión; defensas contra inyecciones de comandos maliciosos; protección de datos privados sin almacenamiento de contraseñas; y controles especiales para riesgos biológicos, con monitoreo en vivo y programas de recompensas por detección de vulnerabilidades.

ChatGPT Agent ya está disponible para usuarios de ChatGPT Pro, Plus y Team. Los usuarios Pro cuentan con 400 mensajes al mes en modo agente, mientras que Plus y Team recibirán acceso progresivo con 40 mensajes mensuales. También se extenderá a planes Enterprise y Educación en las próximas semanas, con un lanzamiento gradual fuera de EE.UU., incluyendo Europa y Suiza. Para usarlo, solo hay que activar el “Modo Agente” desde el menú de herramientas en cualquier conversación, describir la tarea que deseas y seguir en tiempo real el progreso, pudiendo pausar o intervenir cuando quieras.

Esta evolución de ChatGPT representa un salto desde sistemas que responden pasivamente a consultas hacia trabajadores digitales proactivos, combinando razonamiento avanzado, orquestación de herramientas y entornos que preservan el contexto. Esto abre la puerta a usos más autónomos, confiables y orientados a la acción, ampliando el papel de los asistentes de IA más allá de solo brindar respuestas.

Para desarrolladores y científicos de datos, ChatGPT Agent ofrece una plataforma programable y observable capaz de extraer, analizar, sintetizar y exportar información bajo demanda, lo cual potencia flujos de trabajo de próxima generación en investigación, automatización empresarial y productividad personal.

En resumen, ChatGPT Agent no es solo una mejora conversacional, sino un cambio estratégico hacia flujos de trabajo autónomos y generalizados con IA. Marca el paso de los modelos de lenguaje de ser consejeros pasivos a agentes activos que investigan, crean y actúan en un entorno integrado y controlable. Se espera que esta capacidad se convierta en una base para múltiples aplicaciones impulsadas por IA en el futuro cercano.

↗

fuente original

https://www.marktechpost.com/2025/07/18/openai-introduces-chatgpt-agent-from-research-to-real-world-automation/

ver →

etiquetas:openai chatgpt inteligencia artificial automatización herramientas digitales rendimiento en benchmarks seguridad en ia