Por Hannah Pérez  

Nvidia anunció nueva infraestructura y modelos de IA mientras trabaja para construir la tecnología principal para la IA física, incluidos robots y carros autónomos que pueden percibir e interactuar con el mundo real.

***

  • Nvidia presentó innovaciones para construir la tecnología principal para la IA física. 
  • Anunció nueva infraestructura, una guía de código abierto y modelos de IA. 
  • El anuncio estrella es AR1, el primer modelo para movilidad con “sentido común”. 
  • “La próxima ola de IA es la IA física”, dijo el CEO Jensen Huang. 

 

En el marco de la conferencia NeurIPS 2024, Nvidia ha anunciado avances significativos en inteligencia artificial (IA) abierta, enfocados en la “IA física” que une mundos digitales y reales.

El protagonismo recae en herramientas y modelos diseñados para acelerar la investigación en conducción autónoma, robótica y vehículos de nivel 4, capaces de operar sin intervención humana en entornos complejos. Estos lanzamientos, presentados en el Nemotron Summit, refuerzan la visión de Nvidia de democratizar la tecnología para robots y autos inteligentes, fomentando la colaboración global.

El anuncio estrella es Alpamayo-R1 (AR1), descrito por Nvidia como el primer modelo de visión, lenguaje y acción (VLA) a escala industrial, abierto y enfocado en movilidad. Este modelo integra razonamiento en cadena de pensamiento con planificación de rutas, mejorando la seguridad en escenarios viales desafiantes como zonas peatonales adyacentes a carriles para bicicletas.

AR1: innovación para autos inteligentes 

AR1 descompone situaciones complejas en pasos lógicos, evalúa trayectorias posibles con datos contextuales y selecciona la ruta óptima, emulando el “sentido común” humano. Por ejemplo, podría detenerse ante peatones imprudentes o desviarse de un carril ciclista, priorizando la evitación de colisiones.

Técnicamente, AR1 se basa en Cosmos-Reason, un modelo fundacional de razonamiento multimodal lanzado por Nvidia en enero de 2025 y actualizado en agosto. Post-entrenado con aprendizaje por refuerzo, AR1 supera a su versión preentrenada en capacidades de decisión, utilizando datos sintéticos para simular entornos reales. Disponible para uso no comercial en GitHub y Hugging Face, incluye un subconjunto de datos de entrenamiento y evaluación en los NVIDIA Physical AI Open Datasets.

Además, Nvidia liberó AlpaSim, un marco abierto en GitHub para evaluar el rendimiento de AR1 en simulaciones de vehículos autónomos.

Nvidia presenta guía de código abierto y más

Complementando estos modelos, Nvidia presentó Cosmos Cookbook, una guía de código abierto (open source) exhaustiva en GitHub con recetas paso a paso, ejemplos de inferencia rápida y flujos de trabajo avanzados. Cubre curación de datos, generación sintética y evaluación de modelos, facilitando la adaptación para desarrolladores de IA física.

Entre sus aplicaciones destacadas: LidarGen, el primer modelo mundial para generar datos LiDAR en simulaciones de conducción; Omniverse NuRec Fixer, que corrige artefactos en datos reconstruidos neuronalmente con Cosmos Predict; Cosmos Policy, para convertir modelos de video en políticas robustas para robots; y ProtoMotions3, un framework acelerado por GPU en NVIDIA Newton e Isaac Lab, que entrena humanos digitales y robots humanoides con escenas realistas de los Cosmos World Foundation Models (WFMs).

Estos recursos se integran con plataformas como Isaac Lab e Isaac Sim, permitiendo el entrenamiento de modelos como GR00T N para robótica. Socios del ecosistema, incluyendo Voxel51, 1X, Figure AI, Foretellix, Gatik, Oxa, PlusAI, X-Humanoid e investigadores de ETH Zurich, ya aprovechan los WFM de Cosmos para crear escenas 3D en aplicaciones de IA física, desde logística autónoma hasta humanoides.

«La próxima ola de IA es física»

El CEO de Nvidia, Jensen Huang, ha reiterado que “la próxima ola de IA es la IA física“, un mantra que resuena en estos lanzamientos.

Bryan Catanzaro, vicepresidente de investigación en aprendizaje profundo aplicado, abrió el Nemotron Summit enfatizando que Nvidia lidera el Índice de Apertura de Artificial Analysis gracias a licencias permisivas, transparencia en datos y detalles técnicos. Con más de 70 publicaciones, charlas y talleres en NeurIPS, la compañía acelera la innovación en razonamiento IA, campos médicos y vehículos autónomos.

Creo que eventualmente los robots van a ser un jugador enorme en el mundo y queremos básicamente estar haciendo los cerebros de todos los robots. Para hacer eso, necesitamos empezar a desarrollar las tecnologías clave“, había comentado Bill Dally, chief scientist de Nvidia, en una entrevista de verano con TechCrunch.

Este anuncio no solo democratiza herramientas para investigadores, sino que posiciona a Nvidia como pilar en la transición hacia movilidad y robótica autónoma. Disponibles inmediatamente, estos recursos invitan a la comunidad a construir un futuro donde vehículos y robots “piensen” como humanos, reduciendo riesgos y expandiendo horizontes.


Artículo redactado con ayuda de IA, editado por DiarioBitcoin

Imagen de Unsplash


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín