Por Canuto  

OpenAI presentó GPT-5.5 como su modelo más inteligente e intuitivo hasta ahora, con mejoras en codificación agéntica, uso de computadoras, trabajo del conocimiento e investigación científica. La compañía asegura que iguala la latencia de GPT-5.4, usa menos tokens en muchas tareas y llega acompañado de nuevas salvaguardas de seguridad antes de su próximo despliegue en la API.
***

  • GPT-5.5 empieza a desplegarse para usuarios Plus, Pro, Business y Enterprise en ChatGPT y Codex.
  • OpenAI afirma que el modelo mejora en código, navegación web, análisis de datos, ciencia y uso autónomo de herramientas.
  • La API recibirá pronto GPT-5.5 y GPT-5.5 Pro, con precios desde USD $5 por 1 millón de tokens de entrada.


OpenAI anunció el lanzamiento de GPT-5.5, al que describe como su modelo más inteligente y más intuitivo de usar hasta la fecha. La empresa lo presenta como un nuevo paso hacia una forma distinta de trabajar en una computadora, con mayor autonomía para resolver tareas complejas, ambiguas y de varias etapas sin que el usuario deba dirigir cada movimiento.

El despliegue comienza el 23 de abril de 2026 para usuarios Plus, Pro, Business y Enterprise en ChatGPT y Codex. En paralelo, GPT-5.5 Pro empieza a llegar a usuarios Pro, Business y Enterprise en ChatGPT, mientras la compañía prepara la llegada de ambas versiones a la API en una fase posterior.

Según Introducing GPT-5.5 | OpenAI, el modelo destaca en escritura y depuración de código, investigación en línea, análisis de datos, creación de documentos y hojas de cálculo, operación de software y navegación entre herramientas hasta completar una tarea. La firma sostiene que GPT-5.5 entiende más rápido lo que el usuario intenta hacer y puede encargarse de una mayor porción del trabajo por sí mismo.

Para lectores menos familiarizados con este segmento, la idea de una IA agéntica va más allá del chatbot tradicional. En vez de limitarse a responder preguntas, estos sistemas planifican, usan herramientas, verifican sus propios resultados y mantienen el contexto durante procesos largos, un atributo que empieza a ser clave tanto en software como en finanzas, ciencia y operaciones empresariales.

Más capacidad sin perder velocidad

Uno de los argumentos centrales del lanzamiento es que GPT-5.5 ofrece un salto en inteligencia sin sacrificar velocidad. OpenAI asegura que, aunque los modelos más grandes suelen ser más lentos en producción, GPT-5.5 iguala la latencia por token de GPT-5.4 en servicio real y aun así rinde a un nivel de inteligencia superior.

La empresa también afirma que GPT-5.5 usa significativamente menos tokens para completar las mismas tareas de Codex. Esto apunta a una mejora doble: más capacidad y mejor eficiencia. En el Coding Agent Index de Artificial Analysis, OpenAI sostiene que GPT-5.5 entrega inteligencia de vanguardia a la mitad del costo de modelos de frontera competidores para programación.

Ese equilibrio entre rendimiento y costo aparece como uno de los mensajes más relevantes del lanzamiento. Para empresas que dependen de grandes volúmenes de inferencia, el precio total no depende solo de la tarifa por token. También importa cuántos tokens se consumen, cuántos reintentos hacen falta y cuánto tiempo toma terminar un flujo de trabajo completo.

En esa línea, OpenAI explicó que servir GPT-5.5 con la latencia de GPT-5.4 exigió rediseñar la inferencia como un sistema integrado. El modelo fue co-diseñado, entrenado y servido sobre sistemas NVIDIA GB200 y GB300 NVL72. La compañía añadió que Codex y el propio GPT-5.5 ayudaron a optimizar la infraestructura que lo ejecuta, incluyendo heurísticas de balanceo de carga y particionado que elevaron la generación de tokens en más de 20%.

Avances en codificación agéntica

OpenAI sitúa la codificación agéntica como una de las áreas donde GPT-5.5 más se diferencia de su predecesor. En Terminal-Bench 2.0 obtuvo 82,7%, frente a 75,1% de GPT-5.4. En Expert-SWE, una evaluación interna para tareas de largo horizonte con tiempo humano estimado de 20 horas, logró 73,1% frente a 68,5%.

En SWE-Bench Pro, orientado a resolver issues reales de GitHub, GPT-5.5 alcanzó 58,6%, por encima de 57,7% de GPT-5.4, aunque por debajo de 64,3% reportado para Claude Opus 4.7. OpenAI resaltó que, en las tres pruebas, el nuevo modelo mejoró los resultados de GPT-5.4 usando menos tokens.

La empresa dijo que estas mejoras se notan especialmente en Codex, donde GPT-5.5 puede asumir implementación, refactors, depuración, pruebas y validación. Los evaluadores tempranos señalaron una mayor capacidad para entender la forma de un sistema completo, detectar por qué algo falla y anticipar qué otras partes del código deben cambiar tras una corrección.

Entre los testimonios incluidos por la compañía, Dan Shipper, fundador y CEO de Every, afirmó que fue “the first coding model I’ve used that has serious conceptual clarity”. Pietro Schirano, CEO de MagicPath, dijo que trabajar con GPT-5.5 “genuinely feels like I’m working with a higher intelligence”. Un ingeniero de NVIDIA con acceso anticipado llegó a afirmar que perder acceso al modelo “se siente como si me hubieran amputado una extremidad”.

Trabajo del conocimiento y uso real de computadoras

OpenAI también posiciona a GPT-5.5 como una herramienta para el trabajo cotidiano de oficina y análisis profesional. La tesis es que las mismas fortalezas que le permiten programar mejor también lo vuelven más competente para encontrar información, decidir qué importa, usar herramientas, verificar resultados y convertir insumos desordenados en entregables útiles.

En ChatGPT, la modalidad GPT-5.5 Thinking apunta a problemas más difíciles con respuestas más inteligentes y concisas, mientras que GPT-5.5 Pro se orienta a preguntas aún más complejas y tareas donde la precisión importa más. Los primeros evaluadores reportaron mejoras en negocios, derecho, educación y ciencia de datos frente a GPT-5.4 Pro.

En benchmarks ligados a trabajo profesional, GPT-5.5 obtuvo 84,9% en GDPval, 78,7% en OSWorld-Verified y 98,0% en Tau2-bench Telecom sin ajuste de prompt. También registró 60,0% en FinanceAgent, 88,5% en tareas internas de modelado de banca de inversión y 54,1% en OfficeQA Pro.

OpenAI agregó ejemplos de uso interno. Más del 85% de la empresa usa Codex semanalmente en áreas como ingeniería, finanzas, comunicaciones, marketing, ciencia de datos y producto. En comunicaciones, un equipo analizó seis meses de solicitudes de intervenciones y construyó un marco automatizado de puntuación y riesgo. En finanzas, revisaron 24.771 formularios fiscales K-1 que sumaban 71.637 páginas y aceleraron el trabajo en dos semanas frente al año previo. En go-to-market, un empleado automatizó reportes empresariales semanales y ahorró entre 5 y 10 horas por semana.

Investigación científica y matemática

Otro eje del anuncio es la investigación científica. OpenAI sostiene que GPT-5.5 mejora en flujos de trabajo que requieren explorar hipótesis, recopilar evidencia, poner a prueba supuestos, interpretar resultados y decidir el siguiente experimento. En este terreno, reportó una mejora clara sobre GPT-5.4 en GeneBench y BixBench.

En GeneBench, GPT-5.5 obtuvo 25,0% frente a 19,0% de GPT-5.4, mientras GPT-5.5 Pro llegó a 33,2%. En BixBench, GPT-5.5 marcó 80,5% frente a 74,0% del modelo anterior. OpenAI señaló que muchas de estas tareas equivalen a proyectos de varios días para especialistas humanos.

La compañía además aseguró que una versión interna de GPT-5.5, con un arnés personalizado, ayudó a descubrir una nueva prueba sobre números de Ramsey fuera de la diagonal, que luego fue verificada en Lean. El ejemplo se presentó como evidencia de que el modelo puede aportar no solo código o explicaciones, sino también argumentos matemáticos útiles en áreas centrales de investigación.

Entre los casos citados, Derya Unutmaz, profesor e investigador en inmunología en el Jackson Laboratory for Genomic Medicine, usó GPT-5.5 Pro para analizar un conjunto de expresión génica con 62 muestras y casi 28.000 genes. Según su testimonio, el modelo produjo un informe detallado y reveló preguntas e ideas clave, en un trabajo que a su equipo le habría tomado meses. Bartosz Naskręcki, profesor asistente de matemáticas en la Universidad Adam Mickiewicz de Poznań, dijo haber creado con GPT-5.5 en Codex una app de geometría algebraica a partir de un solo prompt en 11 minutos.

Benchmarks, contexto largo y comparación competitiva

OpenAI acompañó el lanzamiento con una amplia tabla de evaluaciones. En BrowseComp, GPT-5.5 registró 84,4% y GPT-5.5 Pro 90,1%. En FrontierMath Tier 1-3, anotó 51,7%, y en Tier 4 llegó a 35,4%, mientras GPT-5.5 Pro alcanzó 52,4% y 39,6%, respectivamente. En CyberGym consiguió 81,8% frente a 79,0% de GPT-5.4.

En razonamiento abstracto, GPT-5.5 marcó 95,0% en ARC-AGI-1 y 85,0% en ARC-AGI-2. En GPQA Diamond obtuvo 93,6%, mientras en Humanity’s Last Exam logró 41,4% sin herramientas y 52,2% con herramientas. Allí, algunos competidores conservaron ventaja en pruebas puntuales, lo que sugiere que la carrera entre laboratorios sigue abierta y muy fragmentada según el tipo de tarea.

El contexto largo aparece como otra mejora importante. En Graphwalks BFS 1M, GPT-5.5 anotó 45,4% frente a 9,4% de GPT-5.4. En OpenAI MRCR v2 de 512K a 1M, registró 74,0% frente a 36,6% del modelo anterior. Para usuarios empresariales y desarrolladores, este punto es clave porque determina si la IA puede trabajar con repositorios, expedientes o documentos muy extensos sin perder el hilo.

OpenAI advirtió que sus evaluaciones se ejecutaron en entorno de investigación, con esfuerzo de razonamiento configurado en xhigh, por lo que algunos resultados podrían diferir ligeramente de ChatGPT en producción. Aun así, el mensaje del lanzamiento es claro: la empresa quiere mostrar a GPT-5.5 como un salto práctico más que como una mejora puramente académica.

Seguridad, ciberseguridad y disponibilidad

La compañía dijo que GPT-5.5 se lanza con su conjunto de salvaguardas más sólido hasta ahora. Antes del lanzamiento, el modelo fue evaluado en marcos de seguridad y preparación, sometido a pruebas con equipos internos y externos de red teaming, y revisado con nuevas evaluaciones dirigidas para ciberseguridad avanzada y biología. OpenAI añadió que también recogió comentarios de casi 200 socios de acceso anticipado.

En ciberseguridad, la empresa reconoció que los modelos de frontera son cada vez más capaces para encontrar y corregir vulnerabilidades. Por eso, GPT-5.5 llega con clasificadores más estrictos para riesgo cibernético potencial, junto con protecciones contra uso indebido repetido. Bajo su Preparedness Framework, las capacidades biológicas, químicas y de ciberseguridad de GPT-5.5 fueron tratadas como Altas, aunque no alcanzaron el umbral Critical.

Al mismo tiempo, OpenAI dijo que ampliará el acceso para usos defensivos verificados mediante Trusted Access for Cyber. Las organizaciones responsables de defender infraestructura crítica podrán solicitar acceso a modelos más permisivos para ciberseguridad, siempre bajo requisitos estrictos. La empresa sostiene que el objetivo es democratizar capacidades defensivas importantes sin relajar controles frente a posibles abusos.

En cuanto a disponibilidad, GPT-5.5 en Codex estará presente en planes Plus, Pro, Business, Enterprise, Edu y Go con una ventana de contexto de 400K. En la API, gpt-5.5 llegará pronto a Responses y Chat Completions por USD $5 por 1 millón de tokens de entrada y USD $30 por 1 millón de tokens de salida, con contexto de 1 millón. También llegará gpt-5.5-pro a USD $30 por 1 millón de tokens de entrada y USD $180 por 1 millón de tokens de salida. Batch y Flex costarán la mitad de la tarifa estándar, mientras Priority tendrá un multiplicador de 2,5x. Aunque OpenAI admite que GPT-5.5 cuesta más que GPT-5.4, argumenta que su mayor inteligencia y eficiencia en tokens compensan esa diferencia.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín