Por Canuto  

Generalist AI presentó GEN-1, un sistema de inteligencia artificial incorporada que, según la empresa, marca un nuevo umbral para la robótica generalista. El modelo eleva la tasa media de éxito de 64% a 99% en varias tareas físicas simples, opera hasta 2,8 veces más rápido que sistemas previos y logra esos resultados con apenas una hora de datos de robot por tarea.
***

  • Generalist asegura que GEN-1 alcanzó tasas de éxito de 99% en varias tareas físicas simples donde GEN-0 promediaba 64%.
  • La empresa afirma que su nuevo sistema completa tareas como doblar cajas o empacar teléfonos hasta 2,8 veces más rápido que el estado del arte previo.
  • El modelo fue entrenado desde cero con más de 500.000 horas de datos físicos del mundo real y, según la compañía, no usa datos de robot en su preentrenamiento.


Generalist AI anunció el lanzamiento de GEN-1, su nuevo sistema de inteligencia artificial para robótica, y lo describió como un avance importante hacia la llamada inteligencia generalista para el mundo físico. La empresa sostiene que este modelo cruza un umbral clave al empezar a dominar tareas físicas simples con niveles de rendimiento que podrían abrir la puerta a usos comerciales más amplios.

De acuerdo con GEN-1: Scaling Embodied Foundation Models to Mastery, publicado por el equipo de Generalist AI el 2 de abril de 2026, el sistema mejora las tasas medias de éxito hasta 99% en tareas donde modelos anteriores lograban 64%. La firma también afirma que puede completar ciertas tareas aproximadamente 3 veces más rápido que el estado del arte anterior y que cada resultado mostrado requirió solo una hora de datos de robot.

El anuncio se enmarca en una carrera más amplia por desarrollar robots capaces de actuar en entornos reales sin depender de flujos rígidos de automatización. A diferencia de muchos sistemas industriales tradicionales, estos modelos buscan adaptarse a objetos, errores y cambios de contexto mediante aprendizaje general, no solo con programación específica para una línea de producción.

La empresa ya había presentado GEN-0 cinco meses antes como una demostración de que existen leyes de escalado en robótica. Ahora sostiene que, tras ampliar datos y cómputo e introducir mejoras algorítmicas, GEN-1 empieza a mostrar un cambio cualitativo, con más fiabilidad, mayor velocidad y mejores respuestas ante escenarios inesperados.

Qué es GEN-1 y por qué Generalist cree que cambia la robótica

Generalist describe GEN-1 como un gran modelo multimodal que emite acciones en tiempo real. Sin embargo, la empresa matiza que llamarlo solo “modelo” se queda corto, porque en la práctica funciona como un sistema completo con varios componentes de inferencia y aprovechamiento, parecido a lo que ocurre con los chatbots y APIs de modelos de lenguaje de frontera.

Según la compañía, GEN-1 fue entrenado desde cero sobre un conjunto de datos que ya suma más de 500.000 horas de interacción física de alta fidelidad en el mundo real. Ese volumen de datos representa una expansión importante respecto a GEN-0 y se acompaña de avances en preentrenamiento, postentrenamiento, aprendizaje por refuerzo, guía humana multimodal y nuevas técnicas en tiempo de inferencia.

Uno de los puntos más llamativos del anuncio es que el conjunto de datos de preentrenamiento contiene cero datos de robot. En su lugar, la empresa asegura que utiliza información capturada con dispositivos portables de bajo costo en humanos realizando millones de actividades, y que luego el sistema puede adaptarse tanto a una nueva tarea como a una nueva encarnación robótica por primera vez durante el ajuste específico.

Generalist afirma que, en algunas pruebas, GEN-1 logra rendimientos comparables a los de GEN-0 usando 10 veces menos datos específicos de tarea y menos pasos de ajuste fino. Ese argumento apunta a una promesa central del sector: reducir el costo de llevar robots a nuevas tareas sin depender de enormes campañas de teleoperación o de simulación.

La empresa compara esta evolución con la trayectoria de los grandes modelos de lenguaje. Su tesis es que GEN-0 habría sido análogo a un primer sistema escalable aún poco útil comercialmente, mientras que GEN-1 empezaría a parecerse al salto de capacidad que permitió a modelos de lenguaje posteriores convertirse en herramientas económicamente viables para tareas concretas.

La “maestría” según Generalist: fiabilidad, velocidad e improvisación

Generalist sostiene que la verdadera medida del progreso en IA física no es solo que un robot termine una tarea. Para la empresa, la “maestría” combina tres variables: fiabilidad, velocidad e inteligencia improvisacional. Esa definición intenta ir más allá de la robótica industrial clásica, donde el éxito depende de entornos muy controlados y secuencias repetitivas.

En fiabilidad, la firma reporta varios experimentos de larga duración sin intervención. Entre ellos menciona preparación de kits de autopartes durante más de una hora, doblado de camisetas 86 veces seguidas, mantenimiento de aspiradoras robot más de 200 veces consecutivas, empaquetado de bloques más de 1.800 veces, doblado de cajas más de 200 veces y empaquetado de teléfonos más de 100 veces seguidas.

La compañía añade cifras comparativas para algunas tareas. En mantenimiento de aspiradoras robot, GEN-1 habría alcanzado 99% de éxito frente a 50% para GEN-0 y 2% para una versión entrenada desde cero sin preentrenamiento. En doblado de cajas, el nuevo sistema llegó a 99%, por encima de 81% en GEN-0 y 13% sin preentrenamiento. En empaquetado de teléfonos, reportó 99%, frente a 62% y 42%, respectivamente.

De forma agregada, Generalist asegura que los modelos entrenados desde cero sin preentrenamiento exhiben un rendimiento promedio de 19%. GEN-0, ajustado a estas tareas, elevaría ese promedio a 64%, pero aún sin alcanzar el nivel de producción. GEN-1, en cambio, cruza hacia una media de 99%, un valor que la empresa considera compatible con despliegues económicamente útiles en algunas aplicaciones.

La velocidad es el segundo eje de esa idea de maestría. En robótica, muchas demostraciones lucen impresionantes pero avanzan a ritmos demasiado lentos para usos reales. Generalist remarca que no solo importa qué tan rápido se mueven los motores, sino qué tan rápido se completa una tarea, sobre todo cuando el aumento de velocidad vuelve más difíciles la percepción, la precisión y la reacción ante cambios dinámicos.

En ese apartado, la empresa afirma que GEN-1 puede doblar una caja en 12,1 segundos, frente a unos 34 segundos para GEN-0 y π₀ en cajas idénticas, así como un tiempo similar para π*₀.₆ en una caja comparable pero distinta. Eso implicaría una mejora de 2,8 veces. También señala que el sistema puede empacar un teléfono en una funda en 15,5 segundos, otra vez a 2,8 veces la velocidad de GEN-0.

Generalist atribuye esas mejoras a varios elementos. Por un lado, sostiene que los modelos aprenden esas velocidades a partir de la experiencia. Por otro, menciona una evolución de su enfoque de inferencia con Harmonic Reasoning, además de la ventaja que ofrecerían sus dispositivos de captura de datos al registrar tareas humanas a mayores velocidades y con dinámicas más fluidas que las obtenidas por teleoperación tradicional.

Improvisación, recuperación y sentido común físico

El tercer componente de la maestría es la improvisación. La empresa argumenta que este factor ha faltado históricamente en la robótica, porque un robot puede ejecutar muy bien una rutina y aun así fallar cuando el mundo se aparta del guion. En entornos no estructurados, esa capacidad de recuperación puede ser más importante que una simple demostración aislada de precisión.

Generalist sostiene que GEN-1 muestra un cambio notable en esa dimensión. En una tarea de preparación de kits automotrices de horizonte largo, por ejemplo, si una arandela es golpeada y deja de estar bien posicionada para el agarre, el robot puede soltarla para recogerla de nuevo, insertarla parcialmente en la ranura para facilitar un reagarre o incluso usar la otra mano para ejecutar una recuperación bimanual.

En objetos deformables grandes, la firma dice haber observado comportamientos de recuperación cuando terminan en configuraciones muy inesperadas. Según la empresa, estos casos están muy fuera de la distribución de entrenamiento y aun así el sistema encuentra modos de seguir adelante, lo que sugiere una forma incipiente de sentido común físico aplicado a la resolución de problemas.

Ese argumento es central para la visión de Generalist. La firma plantea que la inteligencia, en el mundo físico, implica alcanzar el mismo objetivo por medios distintos. Desde esa óptica, la improvisación no es un adorno experimental, sino un atributo que también mejora la fiabilidad y la velocidad general del robot al enfrentar incidentes de cola larga en escenarios reales.

Limitaciones, alineamiento y lo que viene

Pese al tono optimista del anuncio, la empresa reconoce que GEN-1 no resuelve todas las tareas. Generalist admite que no todos los trabajos probados alcanzan tasas de éxito de 99% o más. También señala que algunas tareas requerirían velocidades superiores o niveles de fiabilidad todavía más altos para ser útiles fuera del laboratorio.

Otro punto relevante es el alineamiento. La empresa observa que, a medida que el preentrenamiento a gran escala desbloquea conductas emergentes, también aparecen acciones físicas con consecuencias reales. Una maniobra creativa puede ser una fortaleza en una recuperación no entrenada explícitamente, pero también puede convertirse en un riesgo si no coincide con lo que el usuario espera que el robot haga, o con lo que espera que no haga.

Por eso, Generalist plantea que la definición de éxito en robótica es específica de cada tarea, de cada flujo de trabajo y, en última instancia, del usuario. En ese contexto, la firma dice que su objetivo será mejorar los métodos de alineamiento para dirigir con precisión esos comportamientos emergentes hacia resultados realmente útiles y aceptables en entornos operativos.

La compañía también detalló parte del esfuerzo técnico detrás de GEN-1. Menciona un rediseño de su infraestructura de entrenamiento distribuido para manejar petabytes de datos de interacción física, meses de trabajo en estabilidad del entrenamiento, kernels personalizados, nuevas formas de atención paginada para inferencia en tiempo real, mejoras en postentrenamiento y el despliegue de miles de manos robóticas en nuevas geografías.

Como paso siguiente, Generalist anticipa que futuras generaciones del sistema deberían ampliar el conjunto de tareas complejas que puedan ser dominadas y reducir la cantidad de datos necesaria por tarea. La empresa considera que GEN-1 no representa el final del camino, sino una confirmación de que seguir escalando modelos incorporados puede seguir desbloqueando capacidades emergentes de mayor alcance.

En términos comerciales, la firma indicó que los socios con acceso anticipado pueden empezar a utilizar GEN-1 desde ahora. También habilitó un canal de contacto para alianzas y contrataciones, una señal de que la empresa busca convertir esta etapa técnica en una plataforma de adopción empresarial más amplia.

Más allá del anuncio puntual, el avance toca una discusión de fondo para la inteligencia artificial. Si los grandes modelos de lenguaje transformaron el software al escalar datos y cómputo, el siguiente gran frente podría ser la combinación de percepción, acción y adaptación física en tiempo real. Generalist apuesta a que ese salto no llegará desde reglas rígidas, sino desde modelos capaces de aprender del mundo y reaccionar dentro de él.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín