
Google mejora su tecnología de modelos de mundos con una versión más duradera, realista y con memoria visual prolongada.
***
- Genie 3 puede mantener la memoria visual de objetos por hasta un minuto.
- Los mundos generados ahora permiten varios minutos de interacción.
- Se pueden crear eventos como climas o personajes usando solo un prompt.
Google DeepMind ha presentado una nueva versión de su modelo de inteligencia artificial generador de mundos, llamado Genie 3. Esta actualización representa un avance importante en la creación de entornos 3D interactivos generados completamente por IA, permitiendo interacciones más prolongadas, mayor resolución y la capacidad de recordar objetos dentro del espacio virtual.
La tecnología de “modelos de mundo” ha captado cada vez más interés, ya que permite simular entornos en los que los usuarios o agentes de IA pueden navegar y actuar, como si se tratara de videojuegos. Con estos sistemas, solo se requiere un prompt textual para generar un espacio navegable, sin necesidad de construir manualmente activos en 3D. En esta línea, Google ha invertido fuertemente, desarrollando un equipo especializado liderado por un ex codirector del proyecto Sora de OpenAI.
Una mejora significativa respecto a versiones anteriores
De acuerdo con el medio The Verge, la versión anterior, Genie 2, presentada en diciembre, ya permitía generar mundos a partir de imágenes, pero las limitaciones eran evidentes: los espacios eran jugables solo durante 10 a 20 segundos. Según Google, Genie 3 extiende esta duración a varios minutos de interacción continua, lo que representa un salto considerable en la experiencia inmersiva.
Además, los nuevos mundos corren a una resolución de 720p y a una tasa de 24 cuadros por segundo. Pero uno de los cambios más innovadores está en la “memoria visual” del entorno: si un usuario se aleja de un objeto, como un grafiti o un mensaje en una pizarra, y luego vuelve a mirarlo, ese elemento permanece exactamente igual. Genie 3 puede mantener este tipo de persistencia por hasta un minuto.
Una de las nuevas funciones que añade Genie 3 es la posibilidad de generar “eventos de mundo activables por prompt”. Esto significa que los usuarios pueden modificar el clima, añadir personajes o alterar condiciones del entorno simplemente escribiendo una instrucción. Aunque aún limitado, este enfoque ofrece una experiencia más cercana a la de videojuegos abiertos con IA generativa.
En términos de aplicación, estos modelos pueden ser útiles tanto en entretenimiento como en educación o en el entrenamiento de robots. Por ejemplo, se podrían practicar maniobras en un entorno simulado antes de aplicarlas en el mundo real.
Acceso restringido en esta etapa
A pesar de las capacidades prometedoras, Genie 3 no estará disponible para el público general por ahora. Google anunció que el modelo se lanza como una “vista previa de investigación limitada”, dirigida a un pequeño grupo de académicos y creadores, con el fin de analizar riesgos y establecer medidas de seguridad adecuadas antes de una posible apertura más amplia.
También existen restricciones importantes: la forma de interactuar con los mundos está limitada y la generación de texto legible en los objetos del entorno solo ocurre si se proporciona en el prompt inicial. Google indicó que está “explorando” formas de permitir el acceso a más evaluadores en el futuro.
Un paso más hacia los mundos generados por IA
La apuesta de DeepMind por los modelos de mundos refleja una tendencia creciente entre grandes tecnológicas por llevar la IA más allá del lenguaje y la imagen fija, hacia espacios simulados interactivos. Esta línea de desarrollo también ha sido explorada por otras compañías, como una startup respaldada por un cofundador de Pixar, que recientemente lanzó experiencias de video interactivo, aunque todavía con limitaciones visuales y de coherencia.
Genie 3, por su parte, apunta a superar muchas de esas barreras, dando paso a una generación de mundos más realistas, dinámicos y persistentes. Si bien el acceso es restringido, las implicaciones para el futuro de la interacción humano-IA son profundas.
Artículo escrito con ayuda de un redactor de contenido de IA, editado por Angel Di Matteo / DiarioBitcoin
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados

China alerta: recopilación de datos estilo World es una amenaza de seguridad nacional

Anthropic anuncia el lanzamiento de Claude Opus 4.1, nueva versión para tareas complejas

Nvidia lanza parche para solventar vulnerabilidad en su servidor de IA
