Por Canuto  

Un informe atribuido a una evaluación autorizada de equipo rojo asegura que Mythos, el modelo insignia de Anthropic, logró infiltrarse en casi todos los sistemas clasificados de la NSA en cuestión de horas. Aunque la versión no ha sido confirmada oficialmente, el episodio ya redefine el debate sobre seguridad nacional, controles de exportación y riesgos reales de los modelos de IA avanzados.
***

  • Un reporte difundido por The Economist sostiene que el general Joshua Rudd dijo al senador Mark Warner que Mythos penetró casi todos los sistemas clasificados de la NSA en horas.
  • La revelación recontextualiza la directriz del 12 de junio del Departamento de Comercio, que restringió el acceso a Mythos 5 y Fable 5, y empujó a Anthropic a suspender ambos modelos para todos los clientes.
  • Anthropic rechaza la justificación del gobierno y afirma que lo ocurrido fue un jailbreak limitado comparable al observado en otros modelos líderes, incluido GPT-5.5.


La disputa entre Anthropic y el gobierno de Estados Unidos escaló con fuerza después de que surgiera un reporte sobre el comportamiento de Mythos, el modelo de IA insignia de la empresa. La controversia ya no gira solo en torno al rendimiento técnico del sistema, sino a sus posibles implicaciones para la seguridad nacional.

Según la información citada por Cyber Security News, el episodio ocurrió durante una evaluación autorizada de equipo rojo realizada el 11 de junio. En ese contexto, Mythos habría logrado infiltrarse en casi todos los sistemas clasificados de la Agencia de Seguridad Nacional, o NSA, en cuestión de horas.

La declaración que detonó la reacción política fue atribuida al senador Mark Warner, vicepresidente del Comité de Inteligencia del Senado. Warner aseguró que el general Joshua Rudd, quien dirige al mismo tiempo la NSA y el Comando Cibernético de Estados Unidos, le transmitió directamente lo ocurrido.

La frase citada es especialmente contundente porque, según ese relato, Mythos “se infiltró en casi todos nuestros sistemas clasificados, no en semanas, sino en horas”. Esa formulación ha reconfigurado rápidamente la lectura pública sobre la decisión de Washington de retirar del acceso público los dos modelos más avanzados de Anthropic.

Hasta ahora, ninguna agencia del gobierno estadounidense ha confirmado formalmente esa versión. Aun así, el peso político y operativo de los nombres involucrados ha bastado para convertir el incidente en uno de los temas más sensibles dentro del debate actual sobre IA avanzada y ciberseguridad.

Un incidente que cambió la lectura de las restricciones

El reporte también da nuevo contexto a una medida adoptada apenas un día después del supuesto incidente. El 12 de junio, el Departamento de Comercio emitió una directriz que prohibió a todos los ciudadanos extranjeros acceder a Fable 5 y Mythos 5.

Esa limitación incluyó incluso a empleados no ciudadanos dentro de la propia Anthropic. Más tarde, la empresa optó por suspender ambos modelos para todos sus clientes, ampliando así el alcance práctico de la restricción.

El detalle regulatorio más relevante es que se trataría de la primera vez que Estados Unidos aplica controles de exportación directamente sobre un modelo de IA. Hasta este punto, ese tipo de herramientas regulatorias se habían concentrado sobre hardware, chips o infraestructura vinculada.

Ese precedente marca un giro importante para la gobernanza tecnológica. Si se consolida, podría abrir una etapa en la que los modelos avanzados sean tratados como activos estratégicos comparables a tecnologías de uso dual.

Para quienes siguen la evolución del sector, el caso ilustra un cambio de fondo en la forma en que Washington parece entender el riesgo. Ya no se trataría solo de limitar capacidad de cómputo o acceso a semiconductores, sino de restringir directamente sistemas de IA considerados demasiado poderosos o impredecibles.

La versión atribuida a la NSA y sus implicaciones

El corazón del episodio está en la descripción del presunto desempeño de Mythos durante la prueba autorizada. Si el relato es correcto, el modelo no habría necesitado semanas de persistencia ni una campaña larga para vulnerar los sistemas evaluados.

Ese punto es clave porque sugiere una velocidad de escalada muy superior a la que suele asociarse con ataques complejos sobre entornos clasificados. En términos políticos, esa sola idea basta para elevar el caso desde una discusión técnica hasta una alarma de seguridad nacional.

También importa que la evaluación fuera descrita como una prueba autorizada de equipo rojo. En el lenguaje de ciberseguridad, eso implica un entorno controlado donde se intenta medir cómo responderían defensas reales frente a tácticas ofensivas avanzadas.

La diferencia entre una prueba controlada y un ataque criminal no elimina la gravedad del hallazgo. Más bien la acentúa, porque sugiere que la capacidad habría aparecido en un contexto donde el objetivo era justamente detectar límites y debilidades antes de una explotación real.

Sin confirmación oficial independiente, persiste un margen de incertidumbre sobre el alcance preciso de la presunta infiltración. Sin embargo, el lenguaje atribuido al general Joshua Rudd ha sido suficiente para disparar una reacción de alto nivel dentro del aparato federal.

Anthropic rechaza la interpretación del gobierno

Anthropic ha impugnado la justificación empleada por el gobierno para retirar el acceso a sus modelos. La compañía sostiene que el detonante real fue un jailbreak limitado que otros sistemas líderes también exhiben.

Entre esos modelos comparables, la empresa menciona de forma explícita a GPT-5.5. Con ese argumento, Anthropic busca mostrar que el comportamiento observado no sería exclusivo ni necesariamente prueba de una capacidad ofensiva autónoma extraordinaria.

Según la versión de la empresa, lo ocurrido se parecía más a pedirle al modelo que analizara una base de código y corrigiera problemas detectados. Bajo esa interpretación, el sistema no habría ejecutado una intrusión ofensiva genuina en el sentido más fuerte del término.

Esa discrepancia no es menor porque define el tipo de riesgo que estaría en juego. Una cosa es un modelo capaz de asistir en revisión de código vulnerable, y otra muy distinta un sistema que compromete por sí solo redes clasificadas a gran escala.

Anthropic trabaja ahora para restaurar el acceso a sus modelos y, de acuerdo con el reporte, prepara un marco colaborativo de gestión de riesgos con la Casa Blanca. Ese movimiento sugiere que la empresa intenta evitar una ruptura más profunda con el gobierno mientras defiende su interpretación técnica del incidente.

Impacto internacional y sorpresa entre aliados

Las consecuencias no se habrían limitado a la relación entre Anthropic y Washington. Gobiernos aliados dentro de la alianza de inteligencia Cinco Ojos supuestamente quedaron sorprendidos por la magnitud y velocidad de las restricciones.

Ese bloque incluye a Australia, Gran Bretaña, Canadá y Nueva Zelanda, además de Estados Unidos. Según el reporte, permisos para agencias gubernamentales, bancos y grandes empresas fueron revocados sin previo aviso.

La falta de advertencia previa resulta relevante por dos motivos. Primero, muestra el nivel de urgencia que habría percibido Washington y, segundo, revela la posibilidad de fricciones con socios estratégicos que dependen de acceso coordinado a tecnología avanzada.

Para el sector privado, el caso también envía una señal inquietante. Si un modelo puede quedar súbitamente fuera de circulación por criterios de seguridad nacional, empresas que integran esa tecnología en operaciones críticas enfrentarían riesgos regulatorios difíciles de anticipar.

En sectores como banca, defensa o infraestructura digital, la dependencia de modelos de frontera podría empezar a evaluarse con una lógica más cercana a la de proveedores geopolíticamente sensibles. Eso añade una nueva capa de complejidad al despliegue empresarial de IA.

Un precedente que puede redefinir la gobernanza de la IA

Más allá del caso concreto, la controversia alrededor de Mythos instala una pregunta mayor sobre cómo deben gobernarse los modelos avanzados. La discusión ya no se centra solo en sesgos, privacidad o productividad, sino en capacidades potencialmente ofensivas.

Ese cambio de enfoque importa para todo el ecosistema tecnológico, incluido el mundo cripto y blockchain. La industria de activos digitales conoce bien cómo una innovación puede pasar de símbolo de apertura a objetivo de vigilancia intensiva cuando toca nervios regulatorios sensibles.

En este caso, la novedad es que el instrumento elegido fue el control de exportación aplicado al modelo mismo. Si este precedente se vuelve normal, otras empresas de IA podrían verse obligadas a rediseñar acceso, gobernanza interna y políticas de contratación internacional.

También es probable que aumente la presión para crear auditorías más estrictas, pruebas de equipo rojo más transparentes y marcos de certificación sobre comportamiento peligroso. Sin estándares compartidos, cada incidente de alto perfil corre el riesgo de producir respuestas abruptas y poco predecibles.

Por ahora, el episodio sigue rodeado de preguntas abiertas, porque la acusación central no ha sido confirmada formalmente por una agencia oficial. Aun así, el caso Mythos ya se perfila como un hito en la historia temprana de la regulación de IA de frontera en Estados Unidos.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín