OpenAI presentó una actualización importante para Codex Desktop, su aplicación de programación asistida por IA, que ahora incorpora control de la computadora, navegador integrado, memoria persistente, generación de imágenes y soporte para más de 100 plugins. El movimiento busca llevar la herramienta más allá del desarrollo de software y acercarla a flujos de trabajo más amplios de productividad, aunque la propia empresa reconoce que el producto sigue teniendo un fuerte enfoque en programadores.
***
- Codex Desktop ahora puede operar aplicaciones en segundo plano mediante la función Computer Use, disponible por ahora solo en macOS.
- La actualización añade navegador integrado, memoria para retomar tareas, automatizaciones de largo plazo y generación de imágenes dentro de flujos de trabajo.
- OpenAI lanzó el producto con más de 100 plugins revisados por la empresa y mantiene el acceso para usuarios con permisos de Codex en Mac y Windows.
OpenAI anunció una actualización de peso para Codex Desktop, su aplicación de asistencia para programación, con la que intenta ampliar el alcance del producto hacia tareas generales de productividad. La nueva versión incorpora capacidades que permiten a la IA operar la computadora, mantener memoria entre sesiones, ejecutar automatizaciones más extensas, generar imágenes y trabajar con un navegador integrado dentro de la propia app.
El cambio es relevante porque Codex nació como una herramienta enfocada en desarrollo de software. Ahora, la compañía lo presenta más cerca de una plataforma de productividad agentica, en una línea comparable a propuestas como Claude Cowork. Aun así, OpenAI admitió en una sesión informativa previa al anuncio que Codex Desktop sigue orientado principalmente a programadores, incluso con la expansión de funciones, indica ZDNet.
De acuerdo con la cobertura de ZDNET, una diapositiva mostrada por la empresa indicaba que el 80% del personal de OpenAI usa Codex. Ese dato fue utilizado para respaldar la idea de que la aplicación puede resultar útil también para personas que no se dedican a programar, aunque el propio mensaje del lanzamiento dejó cierta ambigüedad entre su identidad como herramienta técnica y su nueva ambición como centro de productividad.
Control directo de la computadora y trabajo en segundo plano
La novedad más llamativa es la función de uso de la computadora, o Computer Use. En la práctica, esto significa que la IA integrada en Codex Desktop puede operar el equipo del usuario y ejecutar acciones dentro de aplicaciones mientras este continúa trabajando en otros programas.
Según lo presentado por OpenAI, esta modalidad permite que la automatización se ejecute en segundo plano. Eso abre la puerta a flujos donde el agente realiza tareas repetitivas o largas sin bloquear la actividad principal del usuario. Por ahora, sin embargo, esa capacidad solo está disponible en macOS.
La disponibilidad limitada no es un detalle menor. Aunque Codex Desktop se ofrece tanto para Mac como para Windows, la función más ambiciosa del anuncio todavía no llega al sistema de Microsoft. Además, OpenAI indicó que Computer Use aún no está disponible en la Unión Europea.
Para quienes siguen de cerca el desarrollo de agentes de IA, esta función representa otro paso hacia software que no solo responde preguntas, sino que actúa sobre el entorno digital. Ese avance también introduce preguntas sobre supervisión, seguridad y consumo de recursos, especialmente cuando se combinan automatización, acceso al sistema y tareas de larga duración.
Navegador integrado y una interacción más directa con la interfaz
Otra incorporación central es un navegador integrado dentro de Codex Desktop. OpenAI no mostró durante la presentación ejemplos detallados del navegador realizando automatizaciones completas, por lo que queda pendiente evaluar su comportamiento en uso real.
Aun así, la empresa destacó una función especialmente interesante: la posibilidad de hacer clic sobre un elemento del navegador para que la IA entienda exactamente qué objeto se quiere modificar o revisar. En vez de describir de forma extensa una parte específica de una página, el usuario puede señalar el elemento y dar una instrucción directa.
Ese enfoque podría reducir fricción en tareas de edición y navegación. El ejemplo citado fue simple pero ilustrativo: en vez de explicar que se desea cambiar la fuente del tercer titular en la segunda columna, bastaría con pulsar sobre ese componente y pedir la modificación. Si la función resulta fiable, puede ahorrar tiempo en entornos donde la precisión visual importa.
En términos de experiencia de usuario, este detalle apunta a una evolución importante. Muchas herramientas de IA siguen dependiendo de instrucciones textuales largas y ambiguas. Llevar la referencia visual al centro del flujo de trabajo podría hacer que la automatización sea más práctica para perfiles menos técnicos.
Memoria persistente, tareas de largo plazo e insistencia proactiva
OpenAI también amplió el sistema de automatizaciones en Codex Desktop. A partir de esta actualización, las automatizaciones pueden añadirse a hilos conversacionales existentes, lo que permite que la IA retome el contexto acumulado en discusiones previas y lo use para continuar una tarea sin empezar desde cero.
La empresa sostuvo que Codex puede incluso asignarse trabajo a sí mismo. En sus palabras, la app puede “despertarse automáticamente para continuar una tarea de largo plazo, potencialmente a lo largo de días o semanas”. Esa capacidad encaja con la tendencia actual de agentes persistentes que no se limitan a una sola sesión interactiva.
El componente de memoria busca corregir una debilidad previa del producto. Aunque ChatGPT ya contaba con funciones de memoria desde hace tiempo, Codex Desktop tenía problemas para recuperar el hilo tras reinicios o relanzamientos. Con la nueva versión, la aplicación puede recordar preferencias, correcciones e información útil recopilada anteriormente.
OpenAI explicó que esta memoria ayuda a completar tareas futuras con mayor rapidez y con un nivel de calidad que antes exigía instrucciones personalizadas extensas. A eso suma una función de insistencia que se activa al iniciar la app. Según los desarrolladores, Codex ahora propone de forma proactiva trabajo útil para continuar justo donde el usuario lo dejó.
Generación de imágenes y expansión del rol productivo
La actualización también incorpora generación de imágenes dentro de Codex Desktop, un terreno en el que ChatGPT ya tenía capacidades consolidadas, pero la aplicación de escritorio de Codex no. Con este cambio, los usuarios pueden crear agentes capaces de generar imágenes, gráficos o diagramas como parte de una automatización más amplia.
Esto sugiere un uso más transversal del producto. Ya no se trataría solo de escribir o revisar código, sino de integrarlo con tareas de documentación, visualización o presentación de resultados. En entornos empresariales y técnicos, ese tipo de integración puede resultar útil para reportes, prototipos y material de apoyo.
Sin embargo, la efectividad real de esta función todavía depende de pruebas prácticas. El artículo original señala que habrá que verificar qué tan bien funciona en escenarios concretos y si logra mantenerse al nivel de las mejoras recientes vistas en herramientas rivales, en especial en el frente de generación visual.
La inclusión de imágenes refuerza la idea de que OpenAI quiere reposicionar Codex Desktop como una plataforma más amplia. Aun así, el lanzamiento no abandona su ADN técnico. Más bien, parece ampliar la caja de herramientas para usuarios que ya trabajan cerca del software, el análisis y la automatización.
Funciones para desarrolladores, plugins y cautela con el consumo de tokens
Junto a las novedades de productividad, OpenAI añadió varias mejoras dirigidas claramente a desarrolladores. Entre ellas se encuentran el soporte para responder comentarios de revisión en GitHub, múltiples pestañas de terminal, conexión a devboxes remotos mediante SSH en fase temprana de pruebas y visualización de archivos desde la barra lateral con vistas previas enriquecidas para PDF, hojas de cálculo, diapositivas y documentos.
La app también incorpora un nuevo panel de resumen para seguir los planes del agente, sus fuentes y los artefactos generados. Ese tipo de trazabilidad es importante en herramientas agenticas porque ayuda a entender qué hizo el sistema y con base en qué información tomó decisiones o produjo resultados.
Otro punto destacado es el lanzamiento con acceso a más de 100 plugins. En este contexto, OpenAI usa el término para referirse a aplicaciones que combinan habilidades, integraciones con otras apps y servidores MCP para ofrecer capacidades más profundas. La empresa afirmó que revisa y selecciona los plugins antes de habilitarlos, una respuesta que cobra relevancia después de incidentes de malware asociados a habilidades creadas por usuarios en otras plataformas.
En cuanto a la disponibilidad, el nuevo Codex Desktop está abierto para cualquier nivel de OpenAI que tenga acceso a Codex. Funciona en Mac y Windows, aunque Computer Use sigue restringido a macOS y no está habilitado en la Unión Europea. OpenAI advirtió además que ejecutar más automatizaciones y proyectos de larga duración puede consumir más rápido las asignaciones de tokens, por lo que recomendó avanzar con cautela antes de dejar un agente operando sin supervisión.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Destacadas
Alex Wang y Peter Diamandis proponen resolver la escasez global con superinteligencia hacia 2035
Empresas
DeepL entra a la traducción de voz en tiempo real con Zoom, Teams y una nueva API
Empresas
Anthropic mueve ficha frente a Figma y reaviva temores sobre el futuro del software
Empresas