El 17 de julio de 2025, OpenAI lanzó ChatGPT Agent, una evolución que transforma a ChatGPT de un asistente conversacional en un agente de inteligencia artificial capaz de ejecutar, de forma autónoma, tareas complejas y multi-etapa, como navegar por internet o ejecutar código, dentro de un entorno virtual.

Este nuevo agente combina las fortalezas de dos herramientas previas: Operator, que permitía interacciones limitadas en la web como hacer clic, desplazarse y completar formularios; y Deep Research, que ofrecía navegación autónoma y síntesis de reportes a lo largo de períodos más extendidos. Mientras que Operator interactuaba con sitios pero no podía hacer análisis profundos, y Deep Research analizaba información sin poder interactuar activamente, ChatGPT Agent une ambos enfoques en una sola arquitectura que integra navegación, uso de herramientas y razonamiento.

En su núcleo, el agente funciona en un entorno virtual que incluye un navegador visual para páginas orientadas al usuario, un navegador de texto optimizado para razonamientos estructurados, una terminal para ejecutar código y conectores API integrados para servicios como Gmail o GitHub. El agente evalúa continuamente qué acción tomar: hacer clic, ejecutar scripts o analizar contenido, manteniendo el contexto en todas las herramientas utilizadas. Todas las operaciones se realizan dentro de un entorno controlado que garantiza trazabilidad y flexibilidad.

Entre las tareas que ChatGPT Agent puede realizar se encuentran resumir tu agenda automáticamentemante, buscar noticias relevantes y preparar resúmenes de reuniones próximas; hacer la compra localizando ingredientes, comparando precios y completando pedidos; realizar análisis competitivos recopilando y organizando datos de páginas rivales; y actualizar modelos financieros descargando datos y modificando hojas de cálculo sin perder formatos. Estos flujos involucran el uso combinado de diferentes herramientas, desde iniciar sesión en sitios, ejecutar comandos en la terminal, hasta generar documentos editables, siempre con supervisión del usuario.

En cuanto a desempeño, OpenAI reporta mejoras notables en varios indicadores: una tasa de éxito del 41.6% en el test Humanity’s Last Exam (alcanzando hasta 44.4% con intentos paralelos), un 27.4% de precisión en el benchmark FrontierMath con apoyo de código y terminal, y un 45.5% en SpreadsheetBench editando archivos XLSX, superando herramientas como Copilot para Excel. En trabajos basados en conocimiento, el agente iguala o supera el rendimiento de expertos alrededor del 50% de las veces. También establece nuevos récords en tareas basadas en navegación web con 68.9% de aciertos. Estas cifras reflejan un salto en autonomía y sofisticación.

Dado que la autonomía del agente implica riesgos, OpenAI ha implementado varias medidas de seguridad: confirmaciones explícitas antes de cualquier acción importante como compras o publicaciones, un modo “Watch” para tareas sensibles que requieren supervisión activa, defensa contra ataques de inyección de comandos y monitoreo para detectar actividades anómalas, además de mecanismos de privacidad que evitan retener datos sensibles. También incluye protocolos rigurosos para amenazas biológicas, con monitoreo en vivo, entrenamiento para rechazar instrucciones peligrosas y sistemas de recompensas para reportes de fallos, minimizando así posibles usos indebidos.

ChatGPT Agent está ya disponible para los usuarios de ChatGPT Pro, Plus y Team. Los usuarios Pro cuentan con acceso inmediato y pueden enviar hasta 400 mensajes en modo agente al mes. Plus y Team irán recibiendo acceso progresivamente con un límite inicial de 40 mensajes mensuales. Las versiones empresariales y educativas serán incorporadas próximamente. El despliegue ya comenzó fuera de Estados Unidos, incluyendo la Unión Europea y Suiza. Para activarlo solo necesitas cambiar al “Modo Agente” desde el menú de herramientas en cualquier conversación y describir el flujo que deseas. El progreso se narra en tiempo real y puedes pausar o retomar cuando quieras.

Con esta innovación, ChatGPT Agent da un salto de los sistemas pasivos de consulta-respuesta hacia trabajadores digitales proactivos, combinando razonamiento avanzado, orquestación de herramientas y ejecución en entornos con contexto. Esto abre nuevas posibilidades para flujos de trabajo más autónomos y confiables en investigación, automatización empresarial y productividad personal. Para desarrolladores y científicos de datos, este agente es una plataforma flexible y programable, capaz de recopilar, analizar, sintetizar y exportar información bajo demanda.

En resumen, ChatGPT Agent no es solo una mejora conversacional, sino un cambio estratégico hacia flujos de trabajo de IA más generales y autónomos. Representa la transición de los grandes modelos de lenguaje desde asesores pasivos hacia agentes activos que investigan, crean y actúan en el mundo real dentro de un entorno controlado. Se espera que esta capacidad se convierta en una base fundamental en diversos ámbitos potenciados por la inteligencia artificial.

↗

fuente original

https://www.marktechpost.com/2025/07/18/openai-introduces-chatgpt-agent-from-research-to-real-world-automation/

ver →

etiquetas:openai chatgpt agent inteligencia artificial autónoma automatización de tareas navegación web integración de herramientas seguridad en ia