OpenAI lanza GPT-5.4: agentes con uso nativo de computadora y contexto de 1 millón de tokens

𝕏

Hace 3 segundos

Por Canuto

OpenAI anunció el lanzamiento de GPT-5.4 en ChatGPT, la API y Codex, presentándolo como su modelo de frontera más capaz y eficiente para trabajo profesional. La actualización pone el foco en agentes con uso nativo de computadora, una ventana de contexto de hasta 1 millón de tokens, mejoras en hojas de cálculo y presentaciones, y una reducción medible de errores fácticos frente a GPT-5.2.
***

GPT-5.4 llega como “GPT-5.4 Thinking” a ChatGPT (Plus, Team y Pro) y como gpt-5.4 a la API; también debuta GPT-5.4 Pro (Pro y Enterprise) y gpt-5.4-pro en la API.
OpenAI afirma que GPT-5.4 logra 83,0% en GDPval, 75,0% en OSWorld-Verified y que reduce afirmaciones falsas en 33% frente a GPT-5.2 en un set de prompts desidentificados.
El modelo introduce búsqueda de herramientas en la API, soporte experimental de contexto de 1 millón en Codex, y nuevos niveles de detalle de imagen (“original” y “high”) para mejor fidelidad visual.

🚀 Lanzamiento de GPT-5.4 de OpenAI 🤖

Nuevo modelo con capacidades nativas de uso de computadora y contexto de 1 millón de tokens.

Mejoras en hojas de cálculo y presentaciones, con reducción del 33% en errores fácticos respecto a GPT-5.2.

GPT-5.4 Pro dirigido a tareas… pic.twitter.com/QLkZm8OkKR

— Diario฿itcoin (@DiarioBitcoin) March 5, 2026

OpenAI anunció este 5 de marzo de 2026 el lanzamiento de GPT-5.4 en ChatGPT, la API y Codex, describiéndolo como su modelo de frontera más capaz y eficiente para trabajos profesionales. La compañía también presentó GPT-5.4 Pro, una variante orientada a quienes buscan el máximo rendimiento en tareas complejas, disponible tanto en ChatGPT como en la API.

El anuncio llega en un momento en que las empresas aceleran la adopción de herramientas de inteligencia artificial para automatizar tareas de oficina, análisis y desarrollo de software. En ese contexto, el valor práctico ya no se mide solo por “responder bien”, sino por ejecutar flujos completos con menos intervención humana, menos iteraciones y mayor precisión.

Según la comunicación de OpenAI, GPT-5.4 reúne avances recientes en razonamiento, codificación y flujos de trabajo con agentes en un solo modelo. El objetivo declarado es que el sistema pueda completar “trabajos reales” con más efectividad, usando herramientas, operando entornos de software y entregando resultados finales con menos ida y vuelta.

Qué cambia en ChatGPT: Thinking, Pro y enfoque en trabajo profesional

En ChatGPT, OpenAI lanzó GPT-5.4 como “GPT-5.4 Thinking”, y habilitó una función para ofrecer un plan inicial de su pensamiento. La idea es que el usuario pueda revisar ese plan, corregir el rumbo a mitad de la respuesta y llegar a un resultado final más alineado, sin requerir tantas repreguntas.

La compañía también afirma que GPT-5.4 Thinking mejora la investigación en la web profunda, especialmente ante consultas muy específicas. En paralelo, dice mantener mejor el contexto en preguntas que exigen pensamiento prolongado, un punto crítico para trabajos extensos que combinan lectura, síntesis y ejecución.

Junto a Thinking, OpenAI presentó GPT-5.4 Pro en ChatGPT. Esta edición apunta a personas y equipos que requieren el máximo desempeño en tareas complejas, en lugar de un balance general entre velocidad, costo y precisión.

En cuanto a disponibilidad, GPT-5.4 Thinking quedó habilitado para usuarios de ChatGPT Plus, Team y Pro, reemplazando a GPT-5.2 Thinking. OpenAI indicó que GPT-5.2 Thinking seguirá disponible durante tres meses para usuarios pagos bajo “Modelos Legacy” y luego se retirará el 5 de junio de 2026. En planes Enterprise y Edu, el acceso anticipado puede habilitarse desde la configuración de administrador, mientras que GPT-5.4 Pro está disponible para planes Pro y Enterprise.

Agentes con uso nativo de computadora y contexto de 1 millón de tokens

En Codex y la API, OpenAI señaló que GPT-5.4 es su primer modelo de propósito general con capacidades nativas y de vanguardia para “uso de computadora”. En términos prácticos, esto busca habilitar agentes que operen computadoras y ejecuten flujos complejos dentro de aplicaciones, con menos instrucciones paso a paso.

El anuncio incluye soporte de hasta 1 millón de tokens de contexto, orientado a que los agentes puedan planificar, ejecutar y verificar tareas en horizontes largos. Esta capacidad apunta a escenarios donde una tarea real requiere revisar documentos extensos, iterar sobre resultados, y sostener objetivos y restricciones durante más tiempo.

OpenAI también destacó mejoras para trabajar con “grandes ecosistemas de herramientas y conectores” gracias a la búsqueda de herramientas. Con este mecanismo, cuando el modelo necesita una herramienta, puede buscar su definición e incorporarla a la conversación en ese momento, en lugar de cargar todo el inventario de herramientas desde el inicio.

En eficiencia, la empresa afirmó que GPT-5.4 es su modelo de razonamiento más eficiente en uso de tokens hasta la fecha. Según su descripción, usa significativamente menos tokens para resolver problemas que GPT-5.2, lo que se traduciría en menor consumo y mayor velocidad en muchos flujos.

Rendimiento reportado: GDPval, hojas de cálculo, presentaciones y menor tasa de errores

OpenAI presentó métricas internas y de referencia para sostener el salto de GPT-5.4 frente a GPT-5.2. En GDPval, una evaluación que prueba habilidades de agentes para producir trabajo de conocimiento “bien especificado” en 44 ocupaciones, GPT-5.4 alcanzó un nuevo estado del arte.

En ese indicador, la empresa afirmó que GPT-5.4 iguala o supera a profesionales de la industria en 83,0% de las comparaciones. En la versión previa GPT-5.2, ese valor habría sido 70,9%, según los datos reportados en el anuncio.

La compañía dijo haber puesto un enfoque particular en hojas de cálculo, presentaciones y documentos. En un benchmark interno de tareas de modelado en hoja de cálculo que podría realizar un analista junior de banca de inversión, GPT-5.4 registró una puntuación media de 87,3%, frente a 68,4% de GPT-5.2.

En evaluaciones de presentaciones, evaluadores humanos prefirieron las presentaciones de GPT-5.4 68,0% del tiempo sobre las de GPT-5.2. OpenAI atribuyó esa preferencia a una estética más sólida, mayor variedad visual y un uso más efectivo de la generación de imágenes.

En fiabilidad, OpenAI aseguró que sigue reduciendo alucinaciones y errores. En un conjunto de prompts desidentificados donde usuarios señalaron errores fácticos, la empresa sostuvo que las afirmaciones individuales de GPT-5.4 tienen 33% menos probabilidad de ser falsas y que sus respuestas completas tienen 18% menos probabilidad de contener errores, comparadas con GPT-5.2.

Cómo se comporta en “uso de computadora”: Playwright, clics y control por políticas

El anuncio remarcó que GPT-5.4 fue diseñado para una amplia gama de cargas de trabajo de uso de computadora. Entre los ejemplos, OpenAI señaló que el modelo se destaca escribiendo código para operar computadoras con bibliotecas como Playwright, además de emitir comandos de mouse y teclado en respuesta a capturas de pantalla.

También subrayó que su comportamiento es controlable mediante mensajes de desarrollador. Con esto, los equipos pueden ajustar el comportamiento a casos de uso específicos, e incluso configurar el comportamiento de seguridad según tolerancias distintas, usando políticas de confirmación personalizadas.

Como evidencia, OpenAI citó OSWorld-Verified, un benchmark que mide la habilidad para navegar un entorno de escritorio mediante capturas de pantalla y acciones de teclado y mouse. Ahí, GPT-5.4 habría logrado 75,0% de éxito, superando 47,3% de GPT-5.2.

La empresa añadió que, en esa misma medición, GPT-5.4 supera el rendimiento humano en 72,4%. Con esos números, OpenAI lo posicionó como su mejor modelo para desarrolladores que construyen agentes capaces de completar tareas reales en sistemas de software y sitios web.

Mejor visión para imágenes densas y más detalle de entrada

OpenAI indicó que está mejorando la comprensión visual para imágenes densas y de alta resolución, donde la fidelidad completa importa. A partir de GPT-5.4, introduce un nivel de detalle de entrada de imagen llamado “original”.

Ese modo soporta percepción de máxima fidelidad hasta 10,24 millones de píxeles totales o una dimensión máxima de 6.000 píxeles, lo que sea inferior. En paralelo, el nivel “high” ahora soporta hasta 2,56 millones de píxeles totales o una dimensión máxima de 2.048 píxeles.

En pruebas iniciales con usuarios de API, OpenAI reportó mejoras significativas en capacidad de localización, comprensión de imágenes y precisión de clic cuando se usa detalle “original” o “high”. Para acceder a estas capacidades en la API, los desarrolladores pueden usar la herramienta “computer” actualizada, de acuerdo con el anuncio.

Este tipo de avance es relevante para automatización de back office y operaciones digitales. Muchos procesos corporativos todavía dependen de interfaces visuales, paneles y formularios que no exponen APIs completas, por lo que la ejecución basada en pantalla y control de entrada puede ampliar el campo de tareas automatizables.

Codex, latencia y despliegue: qué se habilita desde hoy

En el plano de codificación, OpenAI dijo que GPT-5.4 combina las fortalezas de GPT-5.3-Codex con capacidades de trabajo de conocimiento y uso de computadora. Además, afirmó que iguala o supera a GPT-5.3-Codex en SWE-Bench Pro, mientras mantiene menor latencia.

Sobre despliegue, la empresa señaló que GPT-5.4 se implementa gradualmente hoy en ChatGPT y Codex. En la API, quedó disponible como gpt-5.4, mientras que GPT-5.4 Pro se ofrece como gpt-5.4-pro para quienes requieren máximo rendimiento en tareas más complejas.

En Codex, GPT-5.4 incluye soporte experimental para ventana de contexto de 1 millón. Los desarrolladores pueden probarlo configurando model_context_window y model_auto_compact_token_limit, según se indicó.

OpenAI advirtió que las solicitudes que exceden el conteo estándar de 272.000 tokens se contabilizan contra límites de uso a 2 veces la velocidad normal. En precios, indicó que GPT-5.4 tiene una tarifa por token más alta que GPT-5.2 para reflejar sus capacidades, aunque argumentó que la eficiencia en tokens puede reducir el total de tokens requeridos en muchas tareas. También mencionó que los precios por lote y Flex se ofrecen a la mitad de la tarifa estándar de la API, y que el procesamiento prioritario está disponible al doble de la tarifa estándar.

Finalmente, OpenAI recomendó a clientes Enterprise el uso de su complemento de ChatGPT para Excel, también lanzado el mismo día. La empresa agregó que actualizó las habilidades de manejo de hojas de cálculo y presentaciones disponibles en Codex y la API, reforzando el énfasis en productividad para entornos corporativos.

ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín

𝕏

USDT	Tether USDt	-0,04%	$99,19 mmd
BTC	Bitcoin	-3,32%	$54,14 mmd
ETH	Ethereum	-4,16%	$23,6 mmd
USDC	USDC	-0,0%	$15,33 mmd
SOL	Solana	-4,36%	$4,78 mmd
XRP	XRP	-2,96%	$2,94 mmd
USD1	World Liberty Financial USD	-0,02%	$2,18 mmd
BNB	BNB	-1,85%	$1,74 mmd
DOGE	Dogecoin	-8,19%	$1,65 mmd
XAUt	Tether Gold	-0,8%	$0,854 275 mmd

BARD	Lombard	54,9%	$1,65
H	Humanity Protocol	31,2%	$0,162 329
OKB	OKB	18,63%	$93,3
KITE	Kite	18,37%	$0,271 967
M	MemeCore	7,84%	$1,48
JST	JUST	6,05%	$0,048 986
PIPPIN	pippin	3,91%	$0,350 021
TON	Toncoin	3,18%	$1,35
PI	Pi	2,54%	$0,189 876
MORPHO	Morpho	2,17%	$1,95

ZEC	Zcash	-8,24%	$229,38
DOGE	Dogecoin	-8,19%	$0,094 589
TRUMP	OFFICIAL TRUMP	-6,93%	$3,22
ZRO	LayerZero	-6,74%	$1,86
VIRTUAL	Virtuals Protocol	-6,52%	$0,722 844
STABLE	Stable	-6,48%	$0,027 356
WLFI	World Liberty Financial	-6,48%	$0,102 027
PEPE	Pepe	-5,8%	$0,000 003
HYPE	Hyperliquid	-5,35%	$30,51
SOL	Solana	-4,36%	$89,09

OpenAI lanza GPT-5.4: agentes con uso nativo de computadora y contexto de 1 millón de tokens

Qué cambia en ChatGPT: Thinking, Pro y enfoque en trabajo profesional

Agentes con uso nativo de computadora y contexto de 1 millón de tokens

Rendimiento reportado: GDPval, hojas de cálculo, presentaciones y menor tasa de errores

Cómo se comporta en “uso de computadora”: Playwright, clics y control por políticas

Mejor visión para imágenes densas y más detalle de entrada

Codex, latencia y despliegue: qué se habilita desde hoy

Suscríbete a nuestro boletín

Artículos Relacionados

Pod Network explica cómo su protocolo logra velocidad (300K TPS!) con consistencia eventual y procesamiento en paralelo

OpenAI lanza GPT-5.4: versiones Pro y Thinking con contexto de 1 millón de tokens

Roblox lanza IA que reformula el chat en tiempo real para evitar uso de lenguaje prohibido

Google alerta: casi 50% de los ataques zero-days de 2025 golpeó tecnología empresarial