Yann LeCun, una de las figuras más influyentes en la historia de la inteligencia artificial, defendió una tesis incómoda para buena parte del sector: los grandes modelos de lenguaje son valiosos, pero no representan la ruta hacia una inteligencia comparable a la humana. En una extensa conversación, explicó por qué dejó Meta, por qué creó la startup AMI y por qué cree que los llamados world models serán la base de los sistemas inteligentes del futuro.
***
- Yann LeCun afirmó que los LLM son útiles para lenguaje, código y matemáticas, pero insuficientes para alcanzar inteligencia similar a la humana o incluso animal.
- El investigador explicó que su nueva empresa, AMI, busca desarrollar modelos del mundo capaces de predecir consecuencias, planificar acciones y operar en entornos físicos complejos.
- También defendió una visión más abierta y soberana de la IA con Tapestry, una plataforma pensada para que distintos países y culturas adapten asistentes de IA a sus propios valores y lenguas.
Yann LeCun, uno de los científicos más reconocidos en inteligencia artificial, volvió a desmarcarse del consenso dominante en la industria. Durante la conversación Yann LeCun on What Comes After LLMs, publicada por Unsupervised Learning: With Jacob Effron, sostuvo que los grandes modelos de lenguaje, o LLM, no son el camino hacia una inteligencia de nivel humano.
Su argumento no es que estos sistemas sean inútiles. Al contrario, LeCun reconoció que son la base de muchos productos de IA de gran utilidad y que él mismo los utiliza. Sin embargo, insistió en que su capacidad está fuertemente ligada a la manipulación del lenguaje, el código y ciertos dominios donde el propio lenguaje funciona como sustrato del razonamiento.
Para LeCun, el verdadero reto sigue siendo construir sistemas capaces de entender el mundo físico. Eso implica lidiar con información continua, ruidosa, de alta dimensión y mucho más compleja que una secuencia de tokens. En ese terreno, dijo, la industria necesitará un cambio de paradigma.
Esa convicción explica su salida de Meta y el lanzamiento de una nueva empresa llamada AMI, siglas de Advanced Machine Intelligence. Su lema, según explicó, es “AI for the real world”, una apuesta por sistemas que no solo hablen o escriban, sino que comprendan y anticipen lo que ocurre en entornos reales.
Por qué LeCun cree que los LLM no bastan
La crítica de LeCun a los LLM se centra en una idea esencial: un sistema inteligente debe poder predecir las consecuencias de sus propias acciones. Sin esa capacidad, argumentó, no puede planificar de forma fiable ni comportarse como un agente competente en el mundo físico.
Según su explicación, los humanos y muchos animales actúan anticipando resultados posibles. Esa facultad permite evaluar riesgos, comparar escenarios y diseñar secuencias de acciones para lograr un objetivo. En su visión, los LLM actuales no hacen eso de forma nativa, porque su inferencia se basa en predecir el siguiente token, no en buscar y optimizar planes sobre una representación abstracta del mundo.
LeCun ilustró esta limitación con un ejemplo sencillo: una botella de agua sobre una mesa. Si alguien la empuja desde abajo, puede deslizarse; si la empuja cerca de la parte superior, podría voltearse. Aun así, ni una persona ni una máquina pueden prever cada píxel del resultado, el derrame exacto del agua o la dirección final del movimiento. Lo que sí puede hacerse, sostuvo, es una predicción abstracta del desenlace.
Ese punto lo lleva al núcleo de su tesis: los sistemas inteligentes no deberían generar el mundo a nivel de píxel, sino operar sobre representaciones abstractas. Para LeCun, esa es la razón por la que la generación directa de imágenes o video no ha sido la vía más eficaz para construir comprensión robusta del entorno.
También dijo que los LLM son especialmente eficaces en matemáticas y código porque allí el lenguaje es parte central del razonamiento. En su lectura, pueden ser buenos programadores y solucionadores de problemas bien definidos, pero no equivalen a arquitectos de software ni a científicos de la computación en el sentido más amplio.
Su conclusión fue tajante: estos modelos no “se agotarán” necesariamente, pero sí enfrentarán límites prácticos cada vez mayores. A medida que se intente desplegarlos en más casos de uso, hará falta recopilar enormes cantidades de datos específicos y aun así no se garantizará fiabilidad total, ausencia de alucinaciones ni seguridad en escenarios sensibles.
AMI y la apuesta por los modelos del mundo
La nueva empresa de LeCun nace alrededor de la arquitectura JEPA, siglas de Joint Embedding Predictive Architecture, desarrollada durante su etapa en Meta. El objetivo es construir “world models”, o modelos del mundo, que permitan a un sistema anticipar las consecuencias de sus acciones y luego planificar en consecuencia.
LeCun definió un world model como un componente que deja a un sistema agente predecir el resultado de actuar sobre su entorno. Para él, eso es indispensable. Si un modelo no puede imaginar qué pasará tras una acción, entonces solo reacciona o imita, pero no razona de forma profunda ni planifica con criterio.
Su planteamiento contrasta con parte del entusiasmo actual en robótica, donde abundan demostraciones entrenadas mediante grandes volúmenes de imitación humana y ajuste fino. LeCun reconoció que muchos de esos demos son impresionantes, pero sostuvo que dependen de cantidades masivas de datos y siguen siendo frágiles cuando cambia la tarea o el contexto.
La promesa de los world models, dijo, es una generalización mucho mayor. En teoría, un sistema así podría resolver tareas nuevas con poco entrenamiento o incluso en modo zero-shot, es decir, sin haber sido entrenado específicamente para ese problema. Puso como referencia la facilidad con la que un adolescente de 17 años puede aprender a conducir en unas 12 o 20 horas, frente a los millones de horas de datos de conducción que aún no han producido vehículos autónomos de nivel 5.
Sobre el calendario de desarrollo, fue ambicioso. Bromeó con que en cinco años podría haber “dominación mundial completa”, citando a Linus Torvalds y su vieja frase sobre Linux. Más allá del tono irónico, sostuvo que este tipo de arquitectura terminará siendo el plano base de los sistemas inteligentes del futuro, mientras que los LLM quedarán más como interfaz de lenguaje.
A corto plazo, anticipó que AMI espera tener, en alrededor de 12 a 18 meses, una metodología general para entrenar modelos jerárquicos sobre video y otras modalidades. Espera demostrar aplicaciones en robótica, control de procesos industriales y quizá salud, en colaboración con socios que también participan como inversionistas.
La ruptura con Meta y el problema de la investigación bajo presión
LeCun explicó que Meta dejó de ser el entorno ideal para empujar esta agenda. A su juicio, la empresa se reorientó con fuerza hacia los LLM tras percibir que se había rezagado frente a otros actores del sector. Aunque aseguró que Mark Zuckerberg, Andrew Bosworth y otros ejecutivos mostraban interés en los world models, el resto de la organización estaba concentrado casi por completo en la carrera por ponerse al día con los modelos de lenguaje.
En ese contexto, la investigación exploratoria perdió prioridad. LeCun describió una tensión creciente entre el trabajo de largo plazo y las necesidades de producto a corto plazo. Según relató, esto ya había ocurrido antes dentro de Meta, cuando ciertos proyectos nacidos en FAIR pasaban a organizaciones más orientadas a ingeniería y despliegue.
También se refirió al recorrido de Llama dentro de la empresa. Dijo que Llama 1 fue un proyecto pequeño en FAIR, pero que después se creó GenAI para convertirlo en productos concretos. Esa transición, según su versión, llevó a una cultura más conservadora por la presión de resultados inmediatos, y eso habría afectado la capacidad de innovar en nuevas direcciones.
Sobre Llama 4, señaló que fue una decepción y que eso llevó a Zuckerberg a reorganizar la estructura y contratar nuevas personas. Aun así, aclaró que él no tuvo ninguna contribución técnica en Llama. Su principal intervención, dijo, fue defender la apertura de Llama 2 en un debate interno donde áreas legales y de política pública se mostraban reticentes.
LeCun también quiso corregir una percepción extendida sobre su papel en Meta. Recordó que dirigió FAIR durante unos cuatro años y medio desde 2014, pero que luego dejó la gestión para asumir como chief AI scientist. Desde entonces, dijo, no ordenaba directamente qué debían investigar otros equipos. Su influencia pasaba más por publicar visiones de largo plazo y atraer a quienes compartían su agenda científica.
Su balance sobre FAIR fue positivo en un punto central: haber construido un laboratorio abierto, capaz de producir herramientas fundamentales como PyTorch y de mantener una cultura científica adecuada para los grandes avances. Pero cree que esa cultura se volvió más difícil de sostener a medida que la industria se cerró y la competencia por resultados inmediatos se intensificó.
LLM, seguridad y una crítica directa al paradigma actual
Uno de los pasajes más duros de la entrevista llegó cuando LeCun afirmó que los LLM son “intrínsecamente inseguros”. Según su argumento, no pueden volverse completamente fiables porque no es posible eliminar del todo las alucinaciones ni garantizar que un sistema agente basado en ellos no ejecute acciones cuyos resultados no comprende.
Reconoció que en programación los resultados pueden verificarse contra una especificación, y por eso el desempeño en ese campo puede parecer muy sólido. Sin embargo, advirtió que incluso allí hay episodios en que agentes de código cometen errores costosos, como borrar archivos o dañar sistemas. Fuera de dominios verificables, el problema sería todavía mayor.
Su alternativa es una IA guiada por objetivos. En este esquema, el sistema recibe una meta, simula secuencias de acciones con ayuda de un modelo del mundo y escoge aquellas que minimizan una función de costo. Además, podrían añadirse restricciones y funciones adicionales para evitar daños o comportamientos inseguros.
LeCun reconoció que incluso ese diseño puede fallar si la función de costo es inadecuada o si el world model es impreciso. Aun así, considera que ofrece una base mucho más controlable que un LLM, donde siempre existiría una brecha entre el entrenamiento y los casos reales, y por tanto algún prompt capaz de provocar conductas indeseadas.
En salud, por ejemplo, cree que los LLM pueden ser útiles para resumir conocimiento médico o ampliar acceso a información. Pero para diseñar tratamientos personalizados, modelar la fisiología de un paciente o incluso dirigir la diferenciación de células madre hacia células beta pancreáticas, haría falta un sistema con una comprensión dinámica mucho más rica del mundo biológico.
Tapestry, soberanía en IA y un ecosistema abierto
Además de AMI, LeCun habló de Tapestry, un proyecto distinto pero complementario en torno a modelos fundacionales abiertos. Su preocupación aquí no es solo técnica, sino también política y cultural: si los asistentes de IA median cada vez más el acceso a la información, muchos países podrían terminar consumiendo visiones del mundo moldeadas casi exclusivamente en California o China.
Por eso propone una plataforma abierta, libre y ajustable por terceros, de modo que diferentes comunidades puedan adaptar modelos a su idioma, cultura, sistema de valores y hasta sesgos políticos. El objetivo no sería un único asistente universal, sino una infraestructura capaz de dar lugar a una amplia diversidad de asistentes de IA.
Tapestry, según lo describió, usaría una lógica similar al aprendizaje federado. Los participantes aportarían datos y cómputo sin tener que compartir los datos brutos entre sí. Lo que circularía serían vectores de parámetros, que se acercarían a un consenso global del modelo mientras cada contribuyente mantiene control local sobre su información.
LeCun dijo que existe una fuerza natural hacia este modelo porque muchos países, desde India y Francia hasta Marruecos, Japón o Kazajistán, desean soberanía tecnológica. También cree que, como ya ocurrió con Linux y con buena parte de la infraestructura de Internet, las plataformas de IA terminarán inclinándose hacia esquemas más abiertos.
En su lectura, empresas como OpenAI y Anthropic se parecen más a las antiguas compañías propietarias de infraestructura informática que dominaron los años noventa antes del avance del software abierto. El matiz, sin embargo, es claro: no niega el valor de los sistemas actuales, pero sostiene que el próximo gran salto no vendrá de escalar indefinidamente el mismo paradigma.
Por ahora, su apuesta es que el reconocimiento de ese límite será evidente para inicios de 2027. Eso no significa, aclaró, que la solución definitiva ya esté lista. Pero sí que el cambio de paradigma ya comenzó a abrirse paso, primero como palabra de moda en investigación y luego, posiblemente, como base práctica de una nueva generación de sistemas inteligentes.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
IA
Harbor registra ETF ligados a OpenAI, SpaceX y Anthropic en plena fiebre por IPOs de IA
Entrevistas
Demis Hassabis dice que la AGI llegaría hacia 2030 y cambiaría la ciencia para siempre
Empresas
SpaceX activa su salida a bolsa mientras Anthropic se dispara y OpenAI sorprende en matemáticas
Análisis de mercado