MemPalace fue presentado como una revolución de memoria para IA: gratis, local, de código abierto y respaldado por la imagen de Milla Jovovich. Sin embargo, una revisión independiente citada por el canal AI Godfather sostiene que detrás del furor había métricas infladas, funciones inexistentes, dependencia de API pagas y un código demasiado frágil para sostener las promesas del proyecto.
***
- MemPalace presumía 100% en Loco Mo y 96,6% en Long Mem Eval, pero auditores alegan que esos resultados fueron engañosos.
- El análisis afirma que el sistema no ofrecía memoria real, sino trucos como volcar conversaciones enteras en la ventana de contexto.
- La controversia también salpicó a un memecoin en Solana y reabrió el debate sobre hype, celebridades y verificabilidad en IA.
MemPalace irrumpió en abril de 2026 con una propuesta seductora para el ecosistema de inteligencia artificial: una supuesta memoria perfecta, gratuita, local y de código abierto. La narrativa ganó fuerza por su asociación pública con la actriz Milla Jovovich, conocida por la saga Resident Evil, y por afirmaciones de que el proyecto estaba siendo desarrollado junto con Claude.
La recepción inicial fue explosiva. En menos de dos días, el repositorio de GitHub se acercó a 1.000 estrellas, impulsado por promesas de un sistema capaz de recordar conversaciones con precisión inédita. En un momento marcado por la fiebre por herramientas virales de IA, la idea de una memoria potente sin necesidad de pagar por servicios externos resultó especialmente atractiva.
Pero el entusiasmo empezó a resquebrajarse cuando investigadores independientes revisaron el código y los métodos usados para sostener las afirmaciones públicas. Según expone AI Godfather en MemPalace – How Milla Jovovich’s AI Project Scammed the Internet, lo que se presentaba como un gran salto técnico habría descansado en comparaciones defectuosas, benchmarks dudosos y varias promesas que, al inspeccionarse de cerca, no estaban respaldadas por el software.
El caso es relevante más allá de una sola herramienta. En la industria tecnológica, y en especial en segmentos que rozan la cultura cripto y los memecoins, el marketing puede amplificar proyectos antes de que exista una validación robusta. MemPalace se convirtió, precisamente, en un ejemplo de cómo el atractivo de una narrativa puede adelantar a la evidencia técnica.
Los puntajes estrella quedaron bajo sospecha
Uno de los principales ganchos promocionales de MemPalace fue su supuesto 100% en Loco Mo, acompañado por un 96,6% de recall en Long Mem Eval. Para usuarios no especializados, esas cifras sugerían una superioridad clara frente a otras soluciones de memoria para agentes de IA. El problema, según los críticos citados por el canal, es que la metodología detrás de esos resultados no demostraba lo que el proyecto insinuaba.
La acusación más fuerte señala que el 100% en Loco Mo no provenía de una capacidad real de recuperación de memoria, sino de introducir la conversación completa dentro de la ventana de contexto. En otras palabras, en vez de recordar de forma eficiente y selectiva, el sistema habría recurrido a una carga masiva de datos. Los analistas lo describen como un atajo rudimentario más cercano a un volcado bruto de información que a una arquitectura de memoria avanzada.
Al retirar ese truco, MemPalace habría obtenido apenas 60,3% en Loco Mo. Esa cifra contrasta con el rango de 83% a 89% atribuido a competidores como High Mem, que, según el mismo análisis, alcanzaron esos resultados sin recurrir a ese tipo de práctica. La diferencia es importante porque cambia por completo la narrativa de liderazgo tecnológico que el proyecto intentó instalar.
El propio benchmark Loco Mo también recibió cuestionamientos. De acuerdo con la revisión mencionada, la base de referencia del test contenía 99 respuestas erróneas, ambiguas o alucinadas. Bajo esa óptica, conseguir 100% en una prueba defectuosa no equivaldría a una validación sólida en condiciones reales. Más bien, pondría de relieve los límites del benchmark y la facilidad con la que puede usarse para construir mensajes engañosos.
Long Mem Eval, compresión y la promesa de lo “sin pérdida”
La segunda gran cifra usada por MemPalace fue 96,6% en Long Mem Eval. A primera vista, ese número reforzaba la idea de una solución extraordinaria. Sin embargo, la auditoría citada sostiene que ese rendimiento correspondía simplemente al embedding por defecto de Chroma DB aplicado a texto sin procesar, no a una innovación específica de MemPalace.
El informe añade que el supuesto filtrado elegante por “habitaciones” o rooms, una de las ideas distintivas del proyecto, en realidad habría perjudicado los resultados. Con ese componente activo, el desempeño habría descendido a 89,4%. Lejos de sumar valor, ese diseño habría empeorado la recuperación de información frente a una configuración básica.
Otra función promocionada fue la compresión AAAK, presentada como “lossless” o sin pérdida. Esa etiqueta suele sugerir que el contenido puede comprimirse sin sacrificar integridad. No obstante, la revisión técnica sostiene que esta función provocó una caída de 12,4 puntos porcentuales en recuperación, desde 96,6% hasta 84,2%.
El contraste entre discurso y resultados ayudó a intensificar la reacción en línea. Para muchos observadores, vender compresión sin pérdida y luego mostrar una reducción material en recall no es un detalle menor. Afecta la credibilidad del proyecto y alimenta la sospecha de que varias de sus funciones fueron descritas con un lenguaje mucho más ambicioso de lo que el código realmente permitía.
Promesas de gratuidad y funciones que no aparecían en el código
Una de las afirmaciones más atractivas para la comunidad era que MemPalace no requería API key. En un mercado donde muchas herramientas de IA dependen de servicios pagos, la promesa de una experiencia local y sin costo adicional podía marcar una diferencia real. Sin embargo, los críticos aseguran que los puntajes más llamativos sí dependían de llamadas pagas a Claude.
Si esa acusación es correcta, el mensaje comercial del proyecto habría sido profundamente equívoco. La idea de un producto gratuito y local habría servido para atraer usuarios, mientras que los resultados exhibidos se habrían obtenido con infraestructura externa paga. En términos prácticos, eso cambia la valoración del producto y el costo efectivo de uso.
También se promocionó una capacidad de detección automática de contradicciones. Según la revisión, el código no contenía ninguna función de ese tipo. Esto sugiere que parte del material público describía una visión aspiracional del software más que funcionalidades implementadas. Para una audiencia general, la diferencia entre una hoja de ruta y una capacidad existente puede no ser evidente.
La polémica se agravó porque, según el análisis, documentación interna alojada en archivos de benchmark admitía problemas estructurales en la puntuación de Loco Mo y un enfoque de “teaching to the test”. Ese contexto, siempre según la fuente, no apareció de forma visible en comunicados ni en publicaciones promocionales, lo que reforzó la idea de una comunicación incompleta hacia el público.
Código débil, comparación defectuosa y efecto memecoin
Más allá de los benchmarks, la revisión describió un código inmaduro para un proyecto presentado como gran avance. Se mencionan 21 archivos de Python, cuatro archivos de prueba y solo siete commits totales para la versión 3.0.0. Para los críticos, eso se parecía más a un prototipo ensamblado en un fin de semana que a una base técnica consolidada.
Entre los problemas citados aparecen índices de fila hardcodeados, comparaciones de fechas basadas en cadenas de texto y ausencia de sanitización de entrada. Ese tipo de fallas no solo afecta la elegancia del desarrollo. También puede abrir la puerta a errores, vulnerabilidades y, como señala el análisis, incluso escenarios de prompt injection.
Otro punto cuestionado fue el benchmark ConvMem. Según los auditores, MemPalace comparó recall de recuperación con precisión de respuestas a preguntas, dos métricas distintas que no deberían enfrentarse de forma directa. La crítica sostiene que ese contraste es metodológicamente inválido y puede inducir conclusiones erróneas sobre el verdadero rendimiento del sistema.
La muestra usada para ese benchmark también fue presentada como insuficiente. El análisis habla de 50 ítems por categoría dentro de un universo posible de 75.000 pares. Para los críticos, eso no constituye una evaluación robusta, sino una selección demasiado pequeña y potencialmente favorable para respaldar una historia ya definida de antemano.
En paralelo, el caso tomó un matiz muy familiar para la cultura cripto. Junto con la viralidad del proyecto apareció un memecoin de MemPalace en Solana. Aunque el contenido analizado no ofrece cifras de capitalización, volumen o responsables, la mera aparición del token en medio del furor ayudó a reforzar la percepción de que el fenómeno estaba siendo monetizado mientras crecían las dudas sobre la sustancia técnica.
La combinación de celebridad, código abierto, promesas de IA revolucionaria y un activo meme asociado en Solana resume un patrón conocido en la economía digital contemporánea. Primero llega la narrativa poderosa. Después, la tracción social. Más tarde, los incentivos especulativos. Finalmente, si hay auditoría real, aparece el contraste entre marketing y producto.
En ese sentido, el episodio de MemPalace funciona como advertencia para usuarios, desarrolladores e inversionistas minoristas. No toda herramienta viral con cifras espectaculares y respaldo mediático merece confianza inmediata. En IA, como en cripto, los benchmarks deben interpretarse con cautela, el código debe resistir escrutinio y las promesas comerciales deben coincidir con lo que el producto efectivamente hace.
Hasta donde expone el material de AI Godfather, MemPalace pasó en cuestión de días de ser presentado como un palacio de memoria para agentes inteligentes a quedar retratado como una estructura frágil construida sobre exageraciones. Más que una anécdota aislada, el caso ilustra los riesgos de un mercado donde la atención vale tanto que, a veces, se impone temporalmente sobre la verificación.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Empresas
Anthropic restringe Claude Mythos por su poder para hallar fallas críticas
Empresas
YouTube facilita “deepfakes” de ti mismo: crea tu avatar de IA con la herramienta Shorts
Bancos y Pagos
Visa lanza plataforma para pagos autónomos con agentes de IA
Estados Unidos