Unconventional AI presentó Un-0, un generador de imágenes que sustituye gran parte de la red neuronal tradicional por un sistema de osciladores acoplados. El modelo alcanzó un FID de 6,74 en ImageNet 64×64, liberó pesos y código abierto, y busca abrir una ruta hacia sistemas de IA mucho más eficientes en consumo energético.
***
- Un-0 usa osciladores de Kuramoto como núcleo computacional para generar imágenes condicionadas por clase.
- El modelo logró FID 6,74 en ImageNet 64×64 y FID 8,76 en CIFAR-10 en su mayor configuración reportada.
- La firma sostiene que este enfoque podría contribuir a una IA con cerca de 1.000 veces menos consumo energético.
La firma Unconventional AI presentó Un-0, un modelo generativo de imágenes que reemplaza buena parte de la computación neuronal convencional por la dinámica de osciladores acoplados. La empresa sostiene que este experimento apunta hacia una clase de computadoras donde la física realiza el cálculo de forma directa.
El anuncio fue publicado el 25 de junio de 2026 y plantea una ambición de largo plazo: ejecutar IA moderna con cerca de 1.000 veces menos energía que los sistemas actuales. Como primer paso, la compañía buscó demostrar que un sistema dinámico físico puede entrenarse para generar imágenes a gran escala.
En su mejor resultado sobre ImageNet 64×64 condicionado por clase, Un-0 alcanzó un FID de 6,74. Según la organización, esa calidad coincide con el rango en el que debutaron varios métodos convencionales relevantes cuando fueron presentados por primera vez.
La empresa también liberó los pesos del modelo, además del código de entrenamiento, evaluación y ablación. Esa decisión busca facilitar que otros grupos prueben, reproduzcan y extiendan la propuesta sobre nuevos sustratos físicos o simulados.
Para lectores menos familiarizados con este campo, FID es una métrica habitual para evaluar modelos generativos de imágenes. En términos generales, un valor más bajo indica que las imágenes sintéticas se parecen más a la distribución visual del conjunto de datos real.
Qué es Un-0 y por qué intenta apartarse de la ruta clásica
Durante la última década, la IA moderna se apoyó sobre redes profundas ejecutadas en GPUs. Unconventional AI argumenta que el siguiente salto importante en eficiencia energética no vendrá solo de optimizaciones incrementales, sino de una computadora diferente en su base.
La premisa es que ciertas leyes físicas pueden usarse para computar directamente. En lugar de representar todo como operaciones digitales tradicionales, el sistema aprovecharía la evolución natural de circuitos u otros medios físicos para resolver tareas de IA.
La compañía ubica su trabajo dentro de una línea histórica que incluye computación neuromórfica, redes de Hopfield y computación de reservorio. También menciona desarrollos más recientes como redes hamiltonianas, redes líquidas, máquinas de olas neuronales, computación termodinámica y osciladores de Kuramoto.
En ese marco, Un-0 se presenta como un generador de imágenes basado en la simulación de un sistema dinámico físico. La firma afirma que, hasta donde sabe, se trata del generador más capaz hasta la fecha dentro de esta categoría específica.
La relevancia del experimento no depende solo del resultado visual. También busca validar que cargas de trabajo modernas de IA podrían mapearse de forma eficiente a sustratos físicos distintos del hardware digital que domina hoy.
Cómo funcionan los osciladores acoplados en el corazón del modelo
La intuición que ofrece la empresa parte de dos metrónomos colocados sobre una misma mesa. Cada uno tiene una fase, es decir, una posición angular dentro de su movimiento, y la interacción entre ambos puede llevarlos a sincronizarse o a oscilar en oposición.
Al escalar esa idea a miles de unidades, aparece una población de osciladores que se influencian mutuamente. En Un-0, las fuerzas de acoplamiento entre pares de osciladores constituyen los parámetros aprendibles centrales del sistema.
El comportamiento se modela mediante osciladores de Kuramoto. Cada oscilador gira según su frecuencia natural y, al mismo tiempo, es empujado por la diferencia de fase respecto de los demás, según una matriz de acoplamiento K y un conjunto de frecuencias ω.
En términos prácticos, el aprendizaje consiste en ajustar esa matriz de acoplamiento y las frecuencias naturales. Para la empresa, ese conjunto de parámetros cumple el rol que en otros modelos desempeñaría una pila de capas neuronales convencionales.
Unconventional AI también enmarca esta elección en referencias neurobiológicas y de hardware. Sostiene que la sincronización rítmica es ubicua en el cerebro y, además, resalta que un oscilador puede implementarse como circuito físico en CMOS u otros sustratos.
La arquitectura de Un-0 y su flujo de inferencia
La generación de una imagen en Un-0 sigue cinco pasos. El primero consiste en inicializar la fase de cada oscilador con un ángulo aleatorio entre 0 y 2π, lo que cumple la función de semilla o ruido inicial.
El segundo paso añade la clase deseada mediante un grupo más pequeño de osciladores de condicionamiento. Ese conjunto se acopla a la población principal y sesga la evolución hacia patrones asociados con etiquetas como “margarita” o “volcán”.
Después, el sistema se deja evolucionar en el tiempo según la dinámica de acoplamiento aprendida. En un instante fijado T, el modelo toma una instantánea de las fases y usa esa configuración como representación latente de la imagen.
La etapa final queda a cargo de un decodificador convencional que transforma esa latente en píxeles. La firma enfatiza que ese decodificador representa menos de 13% de los parámetros del modelo en la descripción general y menos de 15% en cada modelo concreto.
Durante el entrenamiento solo se modifican tres elementos: la matriz de acoplamiento K, las frecuencias naturales de los osciladores y los pesos del decodificador. La compañía explica que esta arquitectura se eligió para dar a la dinámica la máxima libertad posible para realizar el cálculo.
Resultados en CIFAR-10 e ImageNet 64×64
Para CIFAR-10, la empresa entrenó tres tamaños de modelo. Un-0.n1024 tuvo 1,29 millones de parámetros y logró FID 11,01, mientras que Un-0.n2048 subió a 4,94 millones de parámetros con FID 9,32.
La mejor variante sobre ese conjunto fue Un-0.n4096. Ese modelo reunió 19,43 millones de parámetros entrenables, de los cuales 17,11 millones correspondieron a osciladores y 2,33 millones al decodificador, con un FID de 8,76.
En ImageNet 64×64, Un-0.n6656 alcanzó FID 8,41 con 57,17 millones de parámetros. Luego, Un-0.n10240 registró FID 8,01 con 129,80 millones de parámetros entrenables.
El mejor resultado llegó con Un-0.n16384. Esa configuración totalizó 322,44 millones de parámetros, con 284,84 millones asociados a osciladores y 37,61 millones al decodificador, y consiguió FID 6,74 usando 50.000 muestras generadas.
Según la comparación incluida por la firma, Un-0 se ubica junto a generadores convencionales tempranos como NCSN, DCGAN-TTUR, WGAN-GP, BigGAN, iDDPM, CD y TRACT. Sin embargo, la propia empresa reconoce que todavía queda por detrás de modelos de mayor rendimiento más recientes como EDM y GDD.
Entrenamiento, evaluación y costo computacional del experimento
El entrenamiento de Un-0 se realizó de extremo a extremo en CIFAR-10 e ImageNet 64×64. Para ello, la firma usó la pérdida de deriva propuesta en 2026 por Mingyang Deng, He Li, Tianhong Li, Yilun Du y Kaiming He, junto con un extractor de características DINOv2 y el optimizador AdamW.
La integración temporal de la dinámica se hizo con un esquema de Euler explícito. En evaluación, la metodología siguió el protocolo habitual con 50.000 muestras generadas tanto para CIFAR-10 como para ImageNet 64×64.
Para CIFAR-10, todos los modelos fueron entrenados en 1 GPU B200. Para ImageNet 64×64, la empresa empleó 8 GPUs B200 en cada entrenamiento reportado.
El modelo más grande sobre CIFAR-10 consumió 20 horas B200 de entrenamiento. En el caso del modelo más grande sobre ImageNet 64×64, el consumo ascendió a 640 horas B200.
La firma explicó que el mayor cuello de botella no fue la simulación de osciladores en sí, sino el cálculo de la pérdida de deriva. Ese proceso requiere un extractor de características de imagen convencional y muchas vistas de características, lo que encarece el entrenamiento.
Qué muestran las ablaciones sobre el rol de la dinámica física
Uno de los objetivos centrales del trabajo fue comprobar que el componente no convencional realmente aporta computación útil. Para eso, la empresa diseñó varias ablaciones destinadas a separar el papel de los osciladores del papel del decodificador.
La primera fue “solo decodificador”. En esa prueba, el decodificador se entrenó sin dinámica alguna, recibiendo directamente ruido inicial y optimizando la misma pérdida que el modelo completo.
La segunda fue “reservorio”. Allí, los pesos dinámicos se mantuvieron congelados en su inicialización aleatoria y el resto del sistema se entrenó igual, con el fin de medir si una dinámica aleatoria bastaba como extractor de características.
La tercera línea de análisis varió el número de pasos de integración durante el entrenamiento. La empresa comparó configuraciones de 1 paso y 10 pasos para observar si una dinámica más fiel y no lineal mejoraba el desempeño.
El resultado general fue que las dinámicas entrenadas superaron a las líneas base con decodificador solo y a las de reservorio, sobre todo cuando se incrementó el número de pasos. Según la compañía, eso sugiere que Un-0 se beneficia de cálculos no lineales reales en la dinámica y no solo de una proyección aleatoria de características.
Separabilidad, atractores y la hipótesis sobre diversidad y calidad
Más allá del FID, la empresa examinó cómo se comportan las trayectorias internas del modelo. En un análisis sobre 50 clases de ImageNet 64×64, observó agrupamientos claros en una proyección de baja dimensionalidad del espacio del decodificador al tiempo T = 1.
La firma también extendió esa evaluación a las 1.000 clases de ImageNet 64×64. Según reportó, 32 dimensiones de ese espacio de baja dimensión bastaron para clasificar más de 90% de las clases en top-1 en modelos entrenados, mientras que los reservorios mostraron menor separación.
Cuando la inferencia se prolonga más allá de T = 1, la organización describe una dinámica en dos fases. La primera separa rápidamente las trayectorias condicionadas por clase y la segunda refina con mayor lentitud las imágenes sobre variedades atractoras condicionales de clase.
Para estudiar calidad y diversidad por separado, el equipo complementó el FID con métricas de precisión y recuperación. En ese marco, sostuvo que las dinámicas de Kuramoto entrenadas ayudan sobre todo a preservar o mejorar la diversidad, mientras que el decodificador convencional cumple el papel principal en la calidad visual.
La empresa indicó que las dinámicas mejoran las imágenes en cerca de 2,5 puntos en el mayor tamaño del sistema y que, dado que el régimen está limitado por recuperación, la ganancia se explica principalmente por un aumento medible de 0,10 en esa métrica al tiempo T = 1.
Qué lugar ocupa Un-0 en la carrera por una IA física
Unconventional AI presenta a Un-0 como un punto de partida, no como una solución final frente al estado del arte. La compañía admite que los modelos convencionales siguen siendo superiores en calidad absoluta y en eficiencia de parámetros a gran escala.
También afirma que Un-0 expande la frontera de Pareto para modelos pequeños dentro de sus comparaciones. En tamaños mayores, sin embargo, la calidad aún mejora más lentamente que en la frontera convencional.
Ese matiz importa porque la propuesta no se limita a competir en una tabla de FID. Su valor estratégico está en explorar si la IA moderna puede reubicarse sobre dinámicas físicas y abrir una ruta hacia una métrica distinta: calidad equivalente con menos julios por inferencia.
La publicación Introducing Un-0: Generating Images with Coupled Oscillators insiste en que el viaje recién comienza. La firma cree que nuevas arquitecturas, algoritmos de aprendizaje y primitivos físicos podrían cerrar parte de la brecha observada hoy frente a alternativas más maduras.
Como siguiente paso, la empresa puso a disposición pesos, scripts de entrenamiento y scripts de ablación para CIFAR-10 e ImageNet. Su mensaje de fondo es claro: si la comunidad logra traducir estas dinámicas a hardware físico eficiente, la próxima gran ruptura de la IA podría venir menos de las GPUs y más de la propia física.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
China
Ofertas de empleo revelan cómo se mueve la carrera de IA en China
Biohacking
Aleph afirma haber logrado la imagen vascular más detallada del cerebro humano con ultrasonido
Hardware
OpenAI lleva ChatGPT a las plantas con Plant Talk y sensores Arduino
Biohacking