La startup Dunia sostiene que el futuro de la inteligencia artificial aplicada a la ciencia no pasa solo por modelos generativos, sino por laboratorios autónomos capaces de producir datos industriales de alta calidad. Su apuesta es ambiciosa: cerrar la brecha entre simulación y realidad, acelerar la I+D y multiplicar la frecuencia de los avances en materiales.
***
- Dunia defiende un tercer camino para la IA científica: combinar simulación, modelos de IA y laboratorios autónomos orientados a pruebas industriales.
- La empresa asegura que el cuello de botella no son tanto los modelos, sino la falta de datos estandarizados, reproducibles y útiles para aplicaciones reales.
- Según su cofundador, desde 1950 solo se han registrado entre 12 y 18 grandes avances industriales en I+D, con un costo agregado cercano a USD $15 billones.
La carrera por automatizar el descubrimiento científico está entrando en una fase más ambiciosa. Ya no se trata solo de pedirle a un modelo que proponga nuevas fórmulas en una pantalla, sino de construir sistemas capaces de llevar esas hipótesis al mundo físico, probarlas con rapidez y generar datos útiles para la industria.
Ese fue el eje de la conversación planteada en THE TRILLION-DOLLAR RACE TO AUTOMATE SCIENTIFIC DISCOVERY, del canal New Wave with Hugo Rauch, donde Hammed, cofundador de Dunia, expuso una visión exigente para la IA aplicada a materiales: el verdadero valor no estaría en simular miles de posibilidades, sino en identificar cuáles pueden fabricarse, mantenerse estables y funcionar en condiciones industriales.
El punto de partida es incómodo para el sector. Durante décadas, buena parte de los avances científicos e industriales dependieron de una mezcla de trabajo disciplinado y serendipia. En palabras del entrevistado, muchos descubrimientos no ocurrieron porque alguien “se despertó y encontró algo”, sino porque estaba avanzando en una dirección y una observación inesperada abrió la puerta a un resultado decisivo.
Ese componente de azar sigue siendo central en ciencia de materiales. Según explicó, el método tradicional se basa en un diseño “hacia adelante”: primero se intenta fabricar un material, luego se dedica gran parte del tiempo a entender qué se obtuvo realmente y, después, se evalúa si sirve para la aplicación deseada. En muchos casos, pequeñas variaciones de humedad, temperatura o presión cambian por completo el resultado.
El problema se complica aún más cuando el material entra en operación. Un catalizador, una batería o un semiconductor puede cambiar de forma y química varias veces durante una reacción o bajo determinadas condiciones. Eso hace que la predicción pura desde computador sea insuficiente, sobre todo cuando el objetivo empresarial no es solo describir la estructura, sino responder una pregunta mucho más concreta: ¿sirve o no sirve para producir algo mejor, más barato o más eficiente?
Tres escuelas de la IA para materiales
Para ordenar el panorama, Hammed dividió el espacio de la llamada “IA para materiales” en tres enfoques. El primero se concentra en modelos generativos y en la idea de un “científico de IA” capaz de proponer fórmulas nuevas a partir de literatura, patentes y datos experimentales. En esta visión, el esfuerzo principal se orienta a ampliar el volumen de información disponible para entrenar modelos.
El segundo enfoque proviene de la química teórica y de la expansión de técnicas como la teoría del funcional de la densidad, o DFT por sus siglas en inglés. Aquí la apuesta es desarrollar simulaciones cada vez más refinadas que describan cómo se comporta un sistema a escala atómica y permitan diseñar materiales ideales antes de escalar su uso industrial.
El tercer enfoque, que Dunia defiende como el más cercano a la realidad empresarial, combina IA, simulación y laboratorios autónomos diseñados no para experimentos académicos básicos, sino para pruebas a nivel de dispositivo industrial. Eso implica fabricar, sintetizar y evaluar materiales en condiciones que las empresas realmente considerarían relevantes para adopción y escalado.
La diferencia es importante. Un material que funciona en un pequeño vial de laboratorio puede ser científicamente interesante, pero no necesariamente útil para una refinería, un electrolizador o una línea de producción. Desde esa perspectiva, la calidad del dato importa más que la cantidad bruta de predicciones.
Dunia afirma haberse movido precisamente en esa dirección. Según explicó su cofundador, la empresa comenzó más cerca del primer enfoque, pero concluyó que no bastaba con generar propuestas desde el software. La razón principal fue la llamada brecha entre simulación y realidad, o “sim to real gap”. Muchas fórmulas prometedoras en pantalla simplemente no podían sintetizarse, no eran estables o no sobrevivían más de unos minutos en un reactor.
El cuello de botella de la reproducibilidad y los datos
Uno de los argumentos más llamativos de la entrevista fue que el principal obstáculo para escalar IA científica no es necesariamente la ausencia de mejores modelos, sino la calidad de los datos. Hammed sostuvo que un científico humano típico tiene una reproducibilidad cercana a 40%, una cifra demasiado baja para entrenar sistemas de IA de forma robusta.
Esa observación ayuda a entender por qué la ciencia de materiales no avanza al ritmo del software. Mientras los modelos de lenguaje pueden entrenarse con enormes volúmenes de texto estandarizado, los experimentos físicos sufren variaciones, errores de ejecución y contextos de laboratorio difíciles de replicar con exactitud. Si el punto de partida ya es inconsistente, el modelo aprende sobre una base defectuosa.
Dunia afirma haber dedicado cerca de un año y medio a resolver ese problema dentro de su plataforma. La empresa pasó, según su relato, de una confiabilidad de alrededor de 55% a 92% en reproducibilidad, gracias a una orquestación precisa de cerca de 10 robots que ejecutan pasos secuenciales y simultáneos dentro de su laboratorio autónomo.
La clave estaría en la trazabilidad. Cada movimiento de un robot, cada transferencia de muestra y cada etapa del proceso quedan registradas. Eso permitiría producir datos estandarizados sobre cómo se predijo un material, cómo se fabricó, cómo se caracterizó y cómo respondió en pruebas cercanas al entorno industrial.
Ese enfoque también modifica la discusión sobre escala. Dunia señaló que su sistema Iris puede ejecutar 56 experimentos completos al día, frente a un laboratorio humano muy eficiente que apenas lograría unos tres por semana si realiza el ciclo completo. Aunque esa cifra todavía queda lejos de las decenas de miles de datos que exige un modelo de IA ambicioso, la empresa intenta compensarlo con simulaciones complementarias.
Entre esas herramientas mencionó descriptores dinámicos y “machine learning force fields”, usados para aproximar el comportamiento real de materiales durante una reacción sin pagar siempre el costo total de simulaciones DFT completas. La idea es combinar unos pocos datos experimentales de alta calidad con simulaciones precisas que llenen vacíos en el espacio de búsqueda.
Un negocio entre la coinnovación y la propiedad intelectual
Más allá del discurso científico, Dunia también intenta resolver una pregunta básica del capital de riesgo: cómo se construye un negocio alrededor de esta infraestructura. Su respuesta actual es un modelo de codesarrollo con empresas industriales interesadas en nuevas químicas, nuevos materiales o mejoras de proceso.
La compañía dijo no operar como una CRO tradicional, sino como un socio tecnológico que comparte riesgos y recompensas, incluyendo propiedad intelectual y potenciales beneficios durante el escalado. En paralelo, también desarrolla una cartera interna de proyectos de alto riesgo y alta recompensa.
En ese punto, Hammed aseguró que Dunia ya patentó dos materiales. Uno de ellos estaría orientado a electrocatalisis y el otro a sustratos para semiconductores. En el primer caso, relató que el equipo identificó una fórmula propuesta por el sistema de razonamiento de la empresa que, desde el conocimiento convencional, parecía poco intuitiva. Sin embargo, al probarla, mostró resultados llamativos en producción de hidrógeno, con menor potencial de inicio y buena estabilidad.
Según detalló, esa línea ya derivó en un proyecto comercial con la empresa española Mateco, especializada en electrolizadores para hidrógeno. El modelo de monetización mencionado incluye licencias de propiedad intelectual con pagos iniciales de millones de dólares y regalías anuales asociadas al uso y eventual escalado industrial.
La apuesta, sin embargo, va más allá de vender una fórmula aislada. Dunia cree que los datos generados por este tipo de laboratorios también pueden convertirse en un activo de alto valor, tanto para entrenar modelos como para abrir nuevos procesos químicos que hoy ni siquiera han sido explorados con profundidad.
La ambición de multiplicar los avances industriales
La narrativa de la empresa se apoya en una crítica fuerte al ritmo actual de la innovación industrial. Hammed afirmó que desde 1950 solo se han producido entre 12 y 18 grandes avances industriales, pese a que la inversión acumulada en I+D industrial habría alcanzado USD $15 billones en ese período. Bajo ese cálculo, cada gran innovación le habría costado al mundo cerca de USD $1 billón.
Uno de los ejemplos citados fue el proceso HPPO, desarrollado por BASF y Dow, presentado como el último gran avance industrial de este tipo, alrededor de 2008. Según explicó, ese proceso permitió reducir capex en 25%, opex en 35% y aguas residuales en más de 80% para la producción de óxido de propileno.
Desde la óptica de Dunia, no es aceptable que la industria genere un avance disruptivo cada 20 años. Su objetivo es convertir el descubrimiento en algo más frecuente, más diseñado y menos dependiente del azar. En el mejor escenario, eso implicaría laboratorios mucho más grandes, los llamados “gigalabs”, capaces de ejecutar entre 500 y 1.000 experimentos diarios y producir decenas de miles de datos industriales por año.
Montar una infraestructura así no es barato. El propio entrevistado estimó que este tipo de instalaciones puede costar desde varias decenas de millones hasta cientos de millones de dólares, dependiendo de su complejidad. Aun así, defendió que ese monto es razonable si el verdadero foso competitivo del sector termina siendo la producción de datos industriales altamente calibrados.
El trasfondo de esa visión conecta con clima, energía y manufactura avanzada. Dunia comenzó mirando casos de uso como hidrógeno verde y conversión de CO2, bajo la idea de que muchas tecnologías climáticas siguen siendo demasiado ineficientes porque los materiales disponibles no fueron diseñados para esas reacciones específicas. Si la IA y la automatización logran reducir la barrera energética de esos procesos, podrían abaratar su adopción.
La promesa, en suma, no consiste solo en tener una IA que “imagine” nuevos materiales. Consiste en construir la infraestructura física y computacional que permita descubrir, probar, validar y escalar nuevas químicas con mucha mayor velocidad. En un momento en que la IA domina titulares por su impacto en texto, imagen y software, Dunia quiere recordar que la economía real sigue dependiendo de algo más difícil: tocar átomos y hacer que funcionen.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Biohacking
Andrew Huberman advierte sobre la fiebre de péptidos mientras los GLP-1 avanzan hacia la masificación
Biohacking
Retatrutida: por qué una doctora la llama la reina de los péptidos para perder grasa
Biohacking
Péptidos chinos: el mercado gris que seduce a biohackers y desafía a la FDA
Empresas