Por Canuto  

OpenAI lleva la inteligencia artificial a un nuevo nivel con ChatGPT Agent, una herramienta capaz de controlar una computadora completa y automatizar tareas cotidianas y profesionales. Lanzada inicialmente para usuarios Pro y Team, esta innovación marca un avance radical en cómo interactuamos con la IA y promete transformar la productividad digital.
***

  • OpenAI presenta ChatGPT Agent, un sistema de IA que automatiza tareas complejas manejando una computadora virtual completa.
  • El agente fusiona capacidades de Operator y Deep Research, y permite desde gestión de agendas hasta compras en línea.
  • Por el momento, las transacciones financieras directas están restringidas y se reforzaron fuertes medidas de seguridad.

OpenAI redefine la interacción con la IA gracias a ChatGPT Agent

OpenAI ha dado un salto adelante en la carrera por la inteligencia artificial al anunciar ChatGPT Agent, una herramienta avanzada capaz de controlar una computadora virtual completa para realizar tareas complejas y rutinarias en nombre del usuario.

Según reportó The Verge, la compañía presentó la solución con una demostración que evidencia su potencial para cambiar drásticamente la forma en que profesionales y usuarios interactúan con la tecnología a diario.

La nueva herramienta busca ir mucho más allá de las funciones tradicionales de un chatbot, desfocalizando la tendencia hacia asistentes conversacionales para apostar por verdaderos agentes de IA, capaces de ejecutar tareas de múltiples pasos de manera autónoma.

Para OpenAI, la meta es crear un asistente digital con una funcionalidad cercana al imaginario popular de J.A.R.V.I.S. de “Iron Man”, vinculado a la vida real.

¿Qué puede hacer ChatGPT Agent?

La propuesta de ChatGPT Agent es que sea capaz de ejecutar acciones como revisar y organizar calendarios, planificar reuniones, gestionar compras en línea, crear presentaciones a partir de análisis de competidores y automatizar tareas administrativas complejas.

Por ejemplo, durante la demostración, se mostró cómo un empleado de OpenAI usa la herramienta para automatizar la solicitud semanal de estacionamiento en las oficinas de San Francisco, acabando con olvidos y procesos manuales.

Otra función exhibida fue la capacidad de planificar una cita nocturna: ChatGPT Agent accede a Google Calendar, localiza un horario libre, consulta OpenTable y sugiere restaurantes según distintas categorías, todo de manera flexible y guiada por interrupciones humanas en tiempo real.

Incluso, la IA puede generar informes de investigación —como comparar el auge de Labubus frente a Beanie Babies—, extendiendo su utilidad tanto a usuarios individuales como a equipos empresariales.

Innovación técnica y enfoque en casos de uso complejos

ChatGPT Agent se apoya en un modelo propio de OpenAI, diseñado y entrenado específicamente para abordar tareas de múltiples pasos que requieren herramientas avanzadas: navegador de texto, navegador visual y terminal para importar datos personalizados. Esta arquitectura fue entrenada con aprendizaje por refuerzo, técnica que la empresa también ha aplicado a sus modelos de razonamiento.

Además, el nuevo agente reúne las capacidades de Operator y Deep Research, dos herramientas anteriores de la compañía, lo que otorga una cobertura funcional mucho más exhaustiva. Para ello, OpenAI unificó los equipos de ambas soluciones y conformó un grupo de entre 20 y 35 expertos en producto e investigación que impulsan el desarrollo.

La combinación de tecnologías permite que el usuario maneje desde compras online sofisticadas y comparativas hasta automatizaciones de la agenda cotidiana. Según Isa Fulford, líder del equipo de investigación, el sistema resulta más integral que el uso aislado de sus predecesoras.

Seguridad, restricciones y salvaguardas

Hechos como el acceso ampliado a toda una “computadora virtual” generan interrogantes sobre la seguridad. OpenAI aclaró en la conferencia que se han activado todas las medidas de protección vigentes para escenarios de “capacidades biológicas y químicas altas”, a pesar de que no exista evidencia de que el modelo pueda facilitar un daño significativo a principiantes en materia de armas biológicas o químicas.

Además, cada acción irreversible (por ejemplo, enviar un correo o realizar una reserva) requiere de la autorización expresa del usuario antes de ser ejecutada. Para evitar riesgos en sitios sensibles, existe un Modo Vigilancia: si el usuario accede a páginas de categorías restringidas, como portales financieros, ChatGPT Agent se suspende automáticamente si la pestaña es abandonada. Por el momento, las transacciones financieras a través del agente están deshabilitadas.

Despliegue escalonado y acceso para usuarios avanzados

OpenAI ha iniciado el despliegue de ChatGPT Agent en un formato de acceso anticipado: los usuarios Pro, Plus y Team ya pueden acceder al “modo agente” desde el menú de herramientas, o ingresando el comando “/agent”. Pronto, la herramienta llegará también a usuarios Enterprise y Education, aunque aún no hay fecha oficial para su disponibilidad en el Área Económica Europea y Suiza.

La experiencia de usuario planeada difiere de otros chatbots: si bien algunas tareas pueden demorar entre 15 minutos y media hora (según Fulford), las acciones que antes tomaban horas quedan condensadas en simples comandos. El objetivo es que los usuarios inicien una automatización en segundo plano y retomen su progreso al concluir.

El auge de los agentes de IA: contexto y competencia

La popularidad de los “agentes de IA” experimentó un verdadero auge desde 2023, momento en que inversores y ejecutivos de tecnología adoptaron el concepto como meta central de desarrollo. Un punto de inflexión fue el anuncio de la fintech Klarna en febrero de 2024, que reveló cómo su agente de IA gestionó dos tercios de sus chats de servicio al cliente, el equivalente a 700 empleados.

El sector ha respondido con iniciativas similares: Anthropic, la startup respaldada por Amazon, lanzó en octubre su herramienta Computer Use, mientras Google, Meta y empresas emergentes como Perplexity y OpenAI refinaron soluciones especializadas que llevan la investigación y la productividad a un nuevo nivel automatizado.

Este movimiento trajo consigo un frenesí de contrataciones orientado a talento en IA agentica, como demostró el reciente reclutamiento por parte de Google de fundadores y expertos de Windsurf. Este fenómeno deja claro que la automatización asistida por agentes está destinada a transformar la economía del conocimiento.

La llegada de ChatGPT Agent posiciona a OpenAI en el epicentro de esta tendencia, afianzando su liderazgo y planteando interrogantes cruciales para el futuro de la integración entre humanos y máquinas.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín