Por Canuto  

Un equipo de Nvidia, Stanford, Caltech y otras instituciones presentó NitroGen, un modelo de base open source entrenado para jugar más de 1.000 videojuegos usando 40.000 horas de videos públicos. Más allá del entretenimiento, la investigación apunta a un objetivo ambicioso: acercar un “GPT para acciones” que ayude a crear agentes corporizados capaces de operar en entornos desconocidos, con implicaciones directas para simulación y robótica.

***

  • Nvidia y aliados académicos presentaron NitroGen como un modelo generalista para videojuegos con ambiciones fuera del gaming.
  • El entrenamiento usó más de 40.000 horas de videos de streamers, especialmente útiles cuando mostraban las entradas del gamepad.
  • El resultado apunta al “instinto del jugador” y reporta una mejora relativa de 52% en éxito de tareas frente a modelos entrenados desde cero.

Un grupo diverso de investigadores de Nvidia, Stanford, Caltech y otras instituciones presentó NitroGen, un modelo de inteligencia artificial orientado a jugar videojuegos, pero con implicaciones que van mucho más allá del entretenimiento. Según informó Tom’s Hardware, el anuncio se hizo público a través de una publicación en LinkedIn realizada el viernes por Jim Fan, Director de IA de Nvidia y Científico Distinguido.

Fan describió a NitroGen como “un modelo de base de código abierto entrenado para jugar a más de 1000 juegos”. El énfasis no está solo en la cifra, sino en lo que sugiere: un sistema capaz de adaptarse a entornos distintos sin requerir entrenamiento específico para cada título, una característica que los investigadores conectan con desafíos históricos en robótica y simulación.

La investigación, siempre de acuerdo con la fuente, plantea un intento de destilar un “GPT para acciones”. Es decir, busca aplicar el enfoque de entrenamiento a gran escala, conocido por su impacto en modelos de lenguaje, a un terreno diferente: el control y la toma de decisiones en ambientes interactivos, donde el tiempo de reacción y la coordinación motora importan tanto como el razonamiento.

Para lectores que recién se acercan al tema, la idea de un “modelo de base” suele asociarse a sistemas entrenados con enormes volúmenes de datos que luego pueden adaptarse a tareas nuevas. En el caso de NitroGen, la apuesta no se centra en generar texto, sino en aprender patrones de acción, asociando observación y control para moverse, reaccionar y resolver tareas dentro de juegos con reglas y físicas variadas.

De un “GPT para acciones” al reto de agentes corporizados

Tom’s Hardware señala que el trabajo se enmarca en un objetivo que investigadores de IA han considerado durante años: crear “agentes corporizados generalmente capaces de operar en entornos desconocidos”, lo que una introducción al trabajo describe como una especie de “santo grial” de la investigación en inteligencia artificial. La frase apunta al reto de lograr sistemas que funcionen fuera de laboratorios controlados.

En robótica, la noción de “agente corporizado” implica un sistema que no solo procesa información, sino que actúa en un entorno, enfrentando incertidumbre, ruido y cambios de condiciones. Los videojuegos sirven como un banco de pruebas atractivo porque ofrecen diversidad de escenarios y una retroalimentación clara, además de permitir entrenar y evaluar sin riesgos físicos.

En ese cruce aparece NitroGen, cuyo enfoque busca aprovechar la variedad extrema del gaming. Un título de carreras exige control fino en trayectorias y velocidad, mientras que un RPG puede demandar exploración y decisiones en contextos cambiantes. Incluso dentro del gaming, la generalización real es difícil, porque pequeñas variaciones de entorno pueden romper estrategias aprendidas de forma rígida.

El interés, sin embargo, no termina en el videojuego. La lectura que propone el reporte es que, si un modelo aprende a operar bajo físicas y mecánicas dispares, ese aprendizaje podría retroalimentar sistemas robóticos que deben adaptarse a entornos diversos o impredecibles. En otras palabras, se intenta que la riqueza del mundo simulado sirva como escalón hacia habilidades aplicables en el mundo real.

Una base robótica: la arquitectura GROOT N1.5

Un elemento llamativo del proyecto es su punto de partida. Según Tom’s Hardware, la base de NitroGen es la arquitectura GROOT N1.5, originalmente diseñada para robótica. Esto sugiere que el diseño del modelo no nació como un experimento de gaming puro, sino como parte de un esfuerzo más amplio por construir sistemas capaces de controlar cuerpos o agentes en interacción con su entorno.

Esta elección también ofrece una pista sobre la dirección del desarrollo. Si un modelo pensado para robótica se adapta con éxito a videojuegos, el flujo de valor puede invertirse: lo aprendido en juegos, con su diversidad de movimientos y situaciones, podría volver a alimentar avances en robots que requieran capacidades similares de control y adaptación.

La relación entre simulación y robótica se ha vuelto más relevante en años recientes, porque entrenar en el mundo físico es costoso y lento. En simulación, en cambio, se pueden generar escenarios, repetir episodios y recolectar grandes volúmenes de datos. NitroGen se inserta en esta lógica, pero con un giro: usa videojuegos como un universo de simulación ya existente, con dinámicas ricas y datos abundantes.

En ese sentido, el aporte no es solo técnico, sino metodológico. El gaming ofrece un “catálogo” de entornos donde el control motor, la planificación y la reacción se mezclan de formas distintas. Para un equipo de investigación, acceder a esa diversidad puede ser más eficiente que construir miles de simuladores desde cero, aunque también introduce retos por la variedad de interfaces y señales.

Cómo lo entrenaron: más de 40.000 horas de videos públicos

De acuerdo con la historia, los investigadores utilizaron más de 40.000 horas de videos de juego públicos compartidos por streamers. Este punto es clave, porque sugiere un enfoque basado en aprendizaje a partir de demostraciones observadas, donde el modelo extrae señales de lo que ocurre en pantalla y lo relaciona con acciones realizadas por un humano.

Un detalle operativo destaca por su importancia: los videos en los que los jugadores superponían sus interacciones con el gamepad en tiempo real fueron “particularmente útiles”. En esos casos, el sistema no solo ve el resultado en pantalla, sino también la entrada que lo causó, lo que facilita construir pares observación-acción y, en teoría, acelerar la adquisición de control.

El uso de material público también abre preguntas relevantes para el ecosistema de IA, aunque la nota se concentra en el logro técnico. Entrenar con videos disponibles en línea permite escalar datos con rapidez, pero exige técnicas para lidiar con ruido, distintas resoluciones, estilos de juego y superposiciones visuales. Aun así, el equipo logró convertir ese mosaico de contenido en un conjunto útil para entrenamiento a gran escala.

En el contexto de modelos de base, el tamaño y diversidad del entrenamiento suelen influir en la capacidad de generalización. NitroGen se apoya en ese principio, pero aplicado a la acción: ver miles de estilos de interacción y mecánicas distintas puede ayudar a construir representaciones más flexibles, en lugar de políticas estrechas que solo funcionan en un juego específico.

Resultados y alcance: del instinto del jugador a juegos desconocidos

En pruebas, NitroGen tuvo éxito en juegos tan diversos como “RPG, plataformas, battle royale, carreras, 2D, 3D, ¡tú lo nombras!”, según el entusiasmo expresado por Fan, citado por Tom’s Hardware. La variedad importa porque sugiere que el modelo no se limita a un género, sino que busca sostener rendimiento en dominios distintos.

Fan también advirtió que esto es solo el comienzo y que todavía queda “una gran colina por escalar”. Esa frase funciona como recordatorio de que el desempeño en videojuegos no equivale automáticamente a capacidad general en el mundo real, y que aún existen limitaciones en robustez, seguridad, consistencia y transferencia entre entornos.

Esta primera versión de NitroGen se centra intencionadamente en el control motor rápido, o el “instinto del jugador”, como lo llamó Fan. En términos prácticos, ese foco apunta a reacciones rápidas y coordinación en tiempo real, un componente esencial para juegos de acción y también para tareas robóticas donde pequeñas demoras pueden causar fallos.

La investigación compartida, según la fuente, sostiene que el nuevo LLM también tiene “una competencia sólida en diversos dominios”. Además, el modelo funciona en mundos generados procedimentalmente y en juegos desconocidos, con una “mejora relativa del 52% en las tasas de éxito de tareas sobre modelos entrenados desde cero”. Esa comparación sugiere ventaja cuando el objetivo es adaptarse sin partir desde cero en cada entorno.

Código abierto y próximos pasos: invitación a experimentar

Tom’s Hardware indica que toda la investigación sobre NitroGen hasta ahora ha sido de código abierto. También se anima a las personas interesadas en juegos, robótica y LLM a experimentar con el proyecto. Este punto tiene implicaciones para la comunidad, porque facilita replicación, evaluación independiente y posibles extensiones por parte de terceros.

Entre los elementos disponibles se mencionan modificaciones a los pesos del modelo preentrenado, el conjunto de datos de acciones completo y el código, los cuales están abiertos a propuestas. Esa apertura podría acelerar iteraciones, aunque también implica que el avance dependerá de cómo la comunidad utilice y valide el trabajo en distintos escenarios.

En la práctica, una iniciativa open source de este tipo puede convertirse en plataforma para investigaciones más específicas. Un equipo puede enfocarse en estabilidad del control, otro en generalización a interfaces distintas, y otro en transferencia hacia simulaciones robóticas más cercanas a la física real. La nota no promete resultados futuros concretos, pero sí sugiere una ruta de exploración amplia.

Por ahora, NitroGen queda como una señal de hacia dónde se mueve la IA aplicada a la acción: modelos de base que intentan aprender no solo a describir el mundo, sino a actuar sobre él. Si esa promesa se materializa en robótica, el impacto podría sentirse en automatización y simulación, campos donde la capacidad de operar en lo desconocido sigue siendo una frontera abierta.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín