El 17 de julio de 2025, OpenAI presentó ChatGPT Agent, una evolución que transforma a ChatGPT de un simple asistente conversacional en un agente de inteligencia artificial unificado capaz de ejecutar de manera autónoma tareas complejas y en varios pasos, desde navegar por internet hasta ejecutar código en un entorno virtual.

Este nuevo agente combina y mejora herramientas previas de OpenAI: por un lado, Operator, que permitía interacciones web limitadas como hacer clic, desplazarse y completar formularios; por otro, Deep Research, que facilitaba la navegación autónoma y la síntesis de informes a lo largo de períodos más largos. Mientras que Operator podía interactuar con páginas web, no realizaba análisis profundos, y Deep Research, aunque analizaba bien, carecía de interacción dinámica con los sitios. ChatGPT Agent integra lo mejor de ambos, unificando la navegación, el uso de herramientas y el razonamiento en una arquitectura única.

En su núcleo, cuenta con un entorno computacional virtual que incluye un navegador visual para sitios orientados al usuario, un navegador de texto optimizado para razonamiento estructurado, una terminal para ejecutar código y conectores API integrados para servicios como Gmail o GitHub. El agente se adapta continuamente, decidiendo cuándo hacer clic, correr scripts o analizar contenido, manteniendo el estado entre sus herramientas. Todas estas acciones se realizan en un contexto controlado que garantiza trazabilidad y flexibilidad.

Entre las tareas que puede realizar ChatGPT Agent están: revisar tu calendario, buscar noticias relacionadas y resumir próximas reuniones; realizar pedidos de supermercado comparando precios y seleccionando ingredientes; hacer análisis competitivos, extrayendo información de páginas y generando presentaciones o hojas de cálculo; o trabajar con modelos financieros descargando datos y actualizando archivos sin perder el formato original. Estas acciones combinan el uso de múltiples herramientas, desde iniciar sesión en sitios hasta ejecutar comandos en la terminal y consolidar resultados en documentos editables, siempre bajo tu supervisión.

En cuanto a su rendimiento, OpenAI destaca mejoras notables en diversas pruebas: obtuvo una tasa de acierto del 41.6% en “Humanity’s Last Exam”, que alcanza hasta 44.4% con ensayos en paralelo; logró un 27.4% de precisión en FrontierMath usando soporte de código y terminal, superando modelos anteriores; obtuvo un 45.5% en la evaluación SpreadsheetBench con edición XLSX, frente a un 20% de Copilot en Excel y un ≈71% humano; y en pruebas internas de trabajo basado en conocimientos, sus herramientas igualan o superan el desempeño de expertos en cerca del 50% de los casos. También logró récords en BrowseComp y WebArena, alcanzando un 68.9% en tareas basadas en navegación web. Estas cifras reflejan un salto importante tanto en autonomía como en complejidad de tareas.

Abrir la puerta a una mayor autonomía conlleva riesgos, por ello OpenAI ha implementado medidas de seguridad como: requerir confirmación explícita antes de acciones críticas (compras, publicaciones), un “modo vigilancia” para supervisar tareas sensibles, defensas ante intentos de manipulación mediante prompts maliciosos, protección de la privacidad mediante modos de captura que no almacenan datos sensibles como contraseñas, y protocolos especiales para riesgos biotecnológicos que incluyen monitoreo activo y sistemas de recompensas por detección de fallos. Todo esto busca minimizar abusos, desde filtración de datos hasta la manipulación del agente.

Actualmente, ChatGPT Agent está disponible para usuarios de ChatGPT Pro, Plus y Team. Los usuarios Pro ya pueden usarlo con un límite de 400 mensajes en modo agente por mes, mientras que Plus y Team recibirán acceso gradual en los próximos días con 40 mensajes mensuales. Las versiones Enterprise y Educación serán lanzadas en las semanas siguientes. Además, se está extendiendo su disponibilidad fuera de EE.UU., en regiones como el EEE y Suiza. Para activarlo sólo hay que seleccionar el “Modo Agente” en el menú de herramientas dentro de cualquier conversación y describir la tarea deseada; el progreso se muestra en tiempo real y se puede pausar o interrumpir en cualquier momento.

La llegada de ChatGPT Agent marca un cambio clave, pasando de sistemas pasivos de respuesta a consultoría a trabajadores digitales proactivos. Combinando capacidades avanzadas de lenguaje, coordinación de herramientas (navegadores, terminales) y entornos que mantienen contexto, OpenAI impulsa casos de uso más autónomos, confiables y orientados a la acción. Aunque es fundamental mantener controles para evitar malas prácticas, este lanzamiento amplía significativamente lo que pueden hacer los asistentes de IA, más allá de solo ofrecer respuestas.

Para desarrolladores y científicos de datos, ChatGPT Agent se convierte en una plataforma programable y observable, capaz de extraer, analizar, sintetizar y exportar información bajo demanda. Esto abre la puerta a nuevas formas de trabajo en investigación, automatización empresarial y productividad personal.

En resumen, ChatGPT Agent no es simplemente una mejora en las conversaciones, sino un giro estratégico hacia flujos de trabajo autónomos y generalizados con IA. Su aparición marca la evolución de los grandes modelos de lenguaje desde simples asesores hasta agentes activos que investigan, crean y ejecutan acciones reales en un entorno unificado y controlable. Se espera que esta capacidad se consolide como base en múltiples áreas potenciadas por la inteligencia artificial.

↗

fuente original

https://www.marktechpost.com/2025/07/18/openai-introduces-chatgpt-agent-from-research-to-real-world-automation/

ver →

etiquetas:openai chatgpt inteligencia artificial autónoma automatización herramientas digitales seguridad en ia aplicaciones empresariales