Un nuevo experimento con modelos de lenguaje avanzados mostró resultados inesperados en la resolución de problemas matemáticos abiertos.
***
- Un ingeniero probó las capacidades matemáticas de un modelo reciente y obtuvo una prueba completa.
- Varios problemas de Erdős han pasado de “abiertos” a “resueltos” con ayuda directa de IA.
- Matemáticos reconocidos observan avances reales, aunque aún limitados, en el razonamiento autónomo.
🤖📊 ¡IMPORTANTE AVANCE EN MATEMÁTICAS CON IA!
Un ingeniero evalúa un nuevo modelo de OpenAI y resuelve problemas matemáticos abiertos.
A pesar de la cautela, 15 problemas de Erdős han sido solucionados con asistencia de IA.
Expertos observan progresos en el razonamiento… pic.twitter.com/aGolCvd78E
— Diario฿itcoin (@DiarioBitcoin) January 14, 2026
Durante un experimento informal realizado el fin de semana, el ingeniero de software y fundador de startups Neel Somani se propuso evaluar hasta dónde podían llegar las capacidades matemáticas de un nuevo modelo de lenguaje de OpenAI. La prueba consistía en introducir un problema matemático abierto y permitir que el sistema razonara sin interrupciones durante un periodo prolongado, algo poco habitual en pruebas convencionales.
Según reseña el medio TechCrunch, tras dejar que el modelo trabajara durante cerca de 15 minutos, Somani regresó y encontró una solución completa y estructurada. El resultado no fue aceptado de inmediato, ya que la verificación seguía siendo indispensable. Para ello, Somani evaluó cuidadosamente el razonamiento y luego formalizó la prueba utilizando una herramienta especializada llamada Harmonic. Según explicó, cada paso del razonamiento se mantuvo coherente y verificable.
Somani señaló que su objetivo inicial era establecer una línea base sobre el momento en que los grandes modelos de lenguaje pueden abordar problemas matemáticos abiertos, en contraste con aquellos en los que todavía fallan. El resultado le sorprendió, ya que el desempeño del modelo más reciente parecía avanzar un poco más allá de lo observado en versiones anteriores.
Razonamiento matemático y fuentes previas
Uno de los aspectos más llamativos del experimento fue la cadena de razonamiento del modelo. El sistema enumeró axiomas y resultados clásicos como la fórmula de Legendre, el postulado de Bertrand y el teorema de la estrella de David, integrándolos en una argumentación coherente. Este tipo de referencias suele requerir una sólida formación matemática y contexto histórico.
En el proceso, el modelo identificó un debate previo publicado en Math Overflow en 2013, donde el matemático de Harvard, Noam Elkies, había propuesto una solución elegante para un problema relacionado. Sin embargo, la prueba generada por la IA no se limitó a reproducir ese trabajo. La solución final difería en aspectos clave y abordaba una versión más completa del problema planteado originalmente por Paul Erdős.
Erdős es una figura central en la matemática del siglo XX, conocido tanto por su prolífica producción como por su extensa colección de problemas abiertos. Este conjunto de conjeturas se ha convertido con el tiempo en un campo de pruebas informal para nuevas ideas y, más recientemente, para sistemas de inteligencia artificial.
Un cambio visible desde la llegada de GPT 5.2
Para quienes mantienen una postura escéptica frente a la inteligencia artificial, el resultado representa una señal inesperada. No se trata de un caso aislado. Herramientas de IA se han vuelto comunes en matemáticas, desde modelos orientados a la formalización, como Aristotle de Harmonic, hasta sistemas de revisión bibliográfica como Deep Research de OpenAI.
Desde el lanzamiento de GPT 5.2, descrito por Somani como “anecdóticamente más hábil en razonamiento matemático que iteraciones anteriores”, el volumen de problemas resueltos con asistencia de IA ha aumentado de forma perceptible. Este crecimiento ha reavivado el debate sobre la capacidad de estos modelos para ampliar las fronteras del conocimiento humano.
Somani centró parte de su análisis en los llamados problemas de Erdős, un conjunto de más de 1.000 conjeturas mantenidas en línea. Estas varían ampliamente en dificultad y temática, lo que las convierte en un objetivo atractivo para la experimentación con sistemas de IA enfocados en matemáticas de alto nivel.
Progresos medibles y cautela académica
Las primeras soluciones autónomas atribuidas a modelos de IA aparecieron en noviembre, impulsadas por un sistema basado en Gemini llamado AlphaEvolve. Sin embargo, en pruebas más recientes, Somani y otros investigadores han observado que GPT 5.2 muestra una destreza notable en problemas matemáticos complejos.
Desde Navidad, 15 problemas han pasado de la categoría de “abiertos” a “resueltos” en el sitio web dedicado a Erdős. De ese total, 11 soluciones reconocen explícitamente la participación de modelos de inteligencia artificial en el proceso de resolución.
El matemático Terence Tao, una de las figuras más respetadas del campo, ofrece una visión más matizada. En su página de GitHub, este identifica ocho problemas en los que la IA logró avances autónomos significativos, junto con otros seis casos donde el progreso provino de localizar y desarrollar investigaciones previas. A su juicio, estos resultados están lejos de demostrar una capacidad totalmente independiente, pero confirman un rol relevante para los modelos de gran escala.
Escalabilidad, formalización y el futuro
En una publicación en Mastodon, Tao sugirió que la naturaleza escalable de los sistemas de IA los hace especialmente aptos para abordar la “larga cola” de problemas de Erdős menos conocidos. Muchos de ellos, explicó, podrían tener soluciones relativamente directas que pasan desapercibidas para investigadores humanos.
Otro factor clave es el avance en la formalización matemática. Este proceso, tradicionalmente laborioso, permite verificar y extender razonamientos con mayor facilidad. Aunque no requiere necesariamente computadoras, la aparición de herramientas automatizadas ha reducido significativamente la carga de trabajo.
Un ejemplo destacado es Lean, un asistente de pruebas de código abierto desarrollado en Microsoft Research en 2013, que se ha popularizado como estándar para formalizar demostraciones. A este ecosistema se suman ahora herramientas impulsadas por IA, como Aristotle de Harmonic, que buscan automatizar gran parte de este proceso.
Para Tudor Achim, fundador de Harmonic, el aumento repentino de problemas resueltos es menos relevante que el cambio cultural que lo acompaña. Según declaró, lo verdaderamente significativo es que profesores de matemáticas y ciencias de la computación estén empezando a utilizar estas herramientas de forma abierta, pese al riesgo reputacional que ello implica.
Artículo escrito con ayuda de un redactor de contenido de IA, editado por Angel Di Matteo / DiarioBitcoin
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
CleanSpark expande su huella en Texas con proyecto energético para IA y minería Bitcoin
Google rechaza acusaciones sobre precios personalizados en su nuevo protocolo de comercio con IA
Bitwise lista siete ETPs cripto en Nasdaq Estocolmo y amplía el acceso regulado en Suecia