Jensen Huang presentó Nemotron 3 Ultra, el modelo abierto más avanzado desarrollado hasta ahora por Nvidia y el más potente creado en Estados Unidos bajo un esquema de pesos abiertos. Sin embargo, pese a sus mejoras en velocidad y rendimiento, el sistema aún se ubica por detrás de varios modelos chinos en inteligencia general.
***
- Nvidia presentó Nemotron 3 Ultra, su mayor modelo abierto hasta la fecha.
- El sistema supera ampliamente a otros modelos open-weight estadounidenses.
- Kimi K2.6 de China continúa liderando el segmento abierto global.
Nvidia aprovechó el escenario de Computex en Taipéi para presentar Nemotron 3 Ultra, el modelo de inteligencia artificial más avanzado desarrollado hasta ahora por la compañía y el más potente dentro del ecosistema open-weight estadounidense.
El anuncio fue realizado por el CEO Jensen Huang, quien reveló un sistema con aproximadamente 550.000 millones de parámetros totales. Gracias a una arquitectura denominada mixture-of-experts (MoE), el modelo activa únicamente unos 55.000 millones de parámetros durante cada consulta, reduciendo considerablemente los costos operativos sin sacrificar capacidades avanzadas de razonamiento, reporta Decrypt.
La estrategia recuerda el funcionamiento de un hospital con cientos de especialistas disponibles, donde únicamente intervienen aquellos necesarios para atender cada caso concreto. Este enfoque permite que el modelo mantenga un tamaño masivo sin requerir el costo computacional asociado a ejecutar todos sus parámetros simultáneamente.
Según Nvidia, esta arquitectura permite alcanzar velocidades de inferencia hasta cinco veces superiores y costos operativos aproximadamente 30% menores frente a otras alternativas abiertas comparables.
El modelo abierto más potente de Estados Unidos
Las primeras evaluaciones independientes posicionan a Nemotron 3 Ultra como el sistema open-weight más capaz desarrollado actualmente en Estados Unidos.
La firma Artificial Analysis, que participó en las pruebas previas al lanzamiento, otorgó al modelo una puntuación de 48 puntos en su Intelligence Index, una métrica que combina resultados de diez pruebas distintas relacionadas con razonamiento, programación, conocimiento general y capacidades de agentes autónomos.
La ventaja frente a otros modelos estadounidenses resulta significativa. Gemma 4 31B de Google alcanza una puntuación de 39, mientras que Nemotron 3 Super, presentado por Nvidia apenas unos meses atrás, obtiene 36 puntos. El modelo open-source de OpenAI, gpt-oss-120b, se ubica aún más abajo con 33 puntos.
La mejora respecto a la generación anterior también es considerable. Nemotron 3 Super fue presentado en marzo de este año como una plataforma sólida para agentes autónomos empresariales, pero Ultra logra superar a su predecesor por 12 puntos completos dentro de la clasificación.
Un millón de tokens de contexto y arquitectura híbrida
La familia Nemotron incluye tres variantes: Nano, orientada a tareas ligeras; Super, enfocada en aplicaciones empresariales intermedias; y Ultra, diseñada para cargas avanzadas de razonamiento. Todos los modelos comparten una arquitectura híbrida que combina Transformers tradicionales, capas Mamba-2 y mecanismos mixture-of-experts.
Uno de los elementos más destacados es el uso de Mamba-2, una tecnología que permite procesar secuencias extremadamente largas con menor costo computacional que los sistemas de atención convencionales. Gracias a ello, Nemotron 3 Ultra soporta una ventana de contexto de hasta un millón de tokens. En teoría, esto permitiría a un agente analizar simultáneamente enormes bases de código, colecciones extensas de documentos o grandes volúmenes de información corporativa sin perder coherencia.
El modelo también incorpora técnicas de multi-token prediction, capaces de generar varios tokens simultáneamente en lugar de producirlos uno por uno, acelerando notablemente la velocidad de respuesta.
Nvidia gana en velocidad, pero no en inteligencia
Donde Nemotron 3 Ultra realmente destaca es en rendimiento operativo. Durante pruebas realizadas en la infraestructura de DeepInfra, el modelo logró generar más de 300 tokens por segundo, una cifra considerablemente superior a la observada en algunos de sus principales competidores.
Por comparación, modelos chinos como DeepSeek V4 Pro y Kimi K2.6 suelen operar actualmente entre 50 y 100 tokens por segundo a través de sus interfaces comerciales. Esta diferencia puede resultar especialmente relevante para agentes autónomos que ejecutan procesos complejos de múltiples pasos, donde cada segundo adicional de espera se acumula a lo largo de toda la tarea.
Sin embargo, la velocidad no necesariamente equivale a mayor inteligencia. Según los mismos datos publicados por Artificial Analysis, Kimi K2.6, desarrollado por la empresa china Moonshot AI, alcanza una puntuación de 54 puntos en el Intelligence Index, seis puntos por encima de Nemotron 3 Ultra.
Dentro de ese ranking global, Kimi se sitúa apenas tres puntos por debajo de los modelos propietarios más avanzados de Anthropic, Google y OpenAI, todos ellos con puntuaciones cercanas a 57.
La ventaja china en modelos abiertos
La comparación vuelve a poner de relieve una tendencia que se ha fortalecido durante los últimos dos años: el liderazgo chino dentro del ecosistema open-source de inteligencia artificial.
Mientras compañías estadounidenses como OpenAI, Anthropic y Google continúan reservando sus sistemas más avanzados para servicios cerrados accesibles mediante API, varios laboratorios chinos han apostado agresivamente por liberar modelos de alto rendimiento bajo esquemas abiertos. Diversos estudios muestran que los modelos open-source chinos pasaron de representar apenas cerca del 1% del uso global a finales de 2024 a alrededor del 30% para finales de 2025.
Nvidia se ha convertido en uno de los principales actores estadounidenses que intenta revertir esa tendencia. La compañía ha revelado previamente planes para invertir aproximadamente USD $26.000 millones durante cinco años en el desarrollo de modelos abiertos de frontera.
Nemotron 4 ya está en camino
Lejos de conformarse con este lanzamiento, Nvidia confirmó que ya trabaja en Nemotron 4, la próxima generación de la familia.
El proyecto será desarrollado junto a la denominada Nemotron Coalition, una alianza creada en marzo de este año que reúne a ocho laboratorios especializados en IA, entre ellos Mistral AI y Perplexity. La iniciativa utilizará la infraestructura DGX Cloud de Nvidia para construir modelos abiertos capaces de competir con las plataformas más avanzadas del mercado.
Mientras tanto, Nemotron 3 Ultra comenzará a estar disponible a partir del 4 de junio. Sus pesos serán públicos y Nvidia también liberará parte de las recetas de entrenamiento utilizadas durante su desarrollo, reforzando su apuesta por fortalecer el ecosistema open-source estadounidense en una carrera que, por ahora, sigue teniendo a China como uno de sus principales referentes.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Capital de Riesgo
La IA golpea a los unicornios que surgieron antes de ChatGPT y hunde capitalizaciones hasta un 68%
Empresas
Alphabet busca recaudar USD $80.000 millones para acelerar su apuesta por la inteligencia artificial
Bancos y Pagos
Circle y Nium quieren resolver el gran obstáculo de los pagos con IA agéntica
Capital de Riesgo