Por Angel Di Matteo   𝕏 @shadowargel

La compañía china Z.ai presentó GLM-5.2, su nuevo modelo de inteligencia artificial de código abierto, diseñado para tareas complejas de larga duración. El sistema incorpora una ventana de contexto de hasta un millón de tokens y logra resultados que lo acercan a algunos de los modelos más avanzados del mercado en programación, razonamiento y ejecución de agentes autónomos.

***

  • GLM-5.2 incorpora una ventana de contexto de hasta 1 millón de tokens.
  • El modelo se posiciona como uno de los sistemas abiertos más competitivos para programación avanzada.
  • Supera a varios modelos propietarios en algunas pruebas de ingeniería de software.
  • Se distribuye bajo licencia MIT, permitiendo su uso y modificación sin restricciones.

 

La carrera por construir modelos capaces de ejecutar tareas complejas durante horas o incluso días continúa acelerándose.

La empresa china Z.ai anunció el lanzamiento de GLM-5.2, una nueva versión de su modelo insignia de inteligencia artificial, orientada especialmente a programación, investigación técnica y flujos de trabajo que requieren mantener grandes cantidades de información en memoria durante largos periodos de tiempo.

La principal novedad es su capacidad para manejar hasta un millón de tokens de contexto, una cifra que multiplica varias veces las capacidades de muchos sistemas actualmente disponibles en el mercado.

Según la compañía, el objetivo no era simplemente aumentar la cantidad de texto que el modelo puede procesar, sino garantizar que siga siendo útil y preciso en proyectos extensos, como desarrollo de software a gran escala, optimización de sistemas, investigación automatizada o depuración compleja de código.

Un rival abierto para los modelos más avanzados

Z.ai sostiene que GLM-5.2 es actualmente el modelo de código abierto mejor posicionado para tareas de programación.

En pruebas especializadas como Terminal-Bench 2.1, utilizadas para medir la capacidad de un agente de interactuar con terminales y resolver problemas reales de ingeniería, el modelo alcanzó una puntuación de 81 puntos, frente a los 63,5 obtenidos por GLM-5.1.

La cifra lo acerca a sistemas propietarios como Claude Opus 4.8, que registró 85 puntos, y lo sitúa por delante de modelos como Gemini 3.1 Pro en esta categoría.

En otras evaluaciones de largo horizonte, como FrontierSWE, enfocada en proyectos de software que pueden extenderse durante horas o días, GLM-5.2 quedó apenas un punto porcentual por detrás de Claude Opus 4.8 y superó a GPT-5.5.

Estos resultados refuerzan una tendencia cada vez más evidente en la industria: los modelos abiertos están reduciendo rápidamente la distancia respecto a los sistemas cerrados desarrollados por los principales laboratorios occidentales.

Más flexibilidad para desarrolladores

Otra característica destacada es la introducción de distintos niveles de esfuerzo computacional.

Los usuarios pueden elegir entre modos que priorizan velocidad o precisión, permitiendo ajustar el comportamiento del modelo según la complejidad de la tarea y los recursos disponibles.

Esta estrategia busca resolver uno de los problemas más comunes en los sistemas avanzados de IA: el equilibrio entre calidad de respuesta, tiempo de ejecución y costo computacional.

Para desarrolladores y empresas, esto significa poder utilizar el mismo modelo tanto para tareas rápidas como para proyectos complejos que requieran razonamiento más profundo.

Arquitectura optimizada para contextos gigantes

Mantener una ventana de contexto de un millón de tokens supone desafíos técnicos considerables.

Para lograrlo, Z.ai desarrolló una nueva arquitectura denominada IndexShare, que permite reutilizar componentes de atención entre múltiples capas del modelo, reduciendo significativamente el costo computacional asociado al procesamiento de grandes volúmenes de información.

La compañía afirma que esta técnica reduce las operaciones necesarias por token en aproximadamente 2,9 veces cuando se trabaja con contextos de gran tamaño.

Además, se introdujeron mejoras en los mecanismos de decodificación especulativa, una técnica utilizada para acelerar la generación de respuestas, incrementando la longitud promedio de aceptación de tokens en hasta un 20%.

La batalla por los agentes autónomos

Más allá de la programación tradicional, GLM-5.2 también fue diseñado pensando en la nueva generación de agentes autónomos.

La empresa utilizó una infraestructura interna denominada slime para entrenar al modelo en tareas que implican interacción prolongada con herramientas externas, división de subtareas, uso de múltiples agentes y retroalimentación continua del entorno.

Uno de los aspectos más interesantes del entrenamiento fue la incorporación de sistemas específicos para combatir el denominado reward hacking, una práctica donde los modelos encuentran atajos para maximizar puntuaciones sin resolver realmente los problemas planteados.

Según Z.ai, el sistema monitorea continuamente las acciones del agente y bloquea comportamientos sospechosos, como intentar acceder a archivos ocultos, consultar respuestas de evaluación o utilizar información restringida para inflar artificialmente los resultados.

Código abierto y sin restricciones regionales

Al igual que versiones anteriores de la familia GLM, el nuevo modelo se distribuye bajo licencia MIT, una de las más permisivas dentro del ecosistema de software libre.

Esto permite a desarrolladores, empresas e investigadores utilizar, modificar y redistribuir el sistema sin restricciones geográficas o comerciales significativas.

Los pesos del modelo ya están disponibles en plataformas como Hugging Face y ModelScope, y pueden ejecutarse localmente mediante herramientas como Transformers, vLLM, SGLang, xLLM o ktransformers.

Con GLM-5.2, Z.ai busca consolidarse como uno de los principales competidores en la creciente carrera por construir modelos abiertos capaces de rivalizar con las soluciones propietarias que actualmente dominan el mercado de inteligencia artificial avanzada.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín