Por Canuto  

El lanzamiento de Fable, el nuevo modelo público de Anthropic orientado a ciberseguridad, abrió un debate incómodo en la industria: mientras la empresa intenta impedir usos maliciosos, varios investigadores sostienen que las restricciones son tan amplias e inconsistentes que también bloquean tareas legítimas y rutinarias.
***

  • Anthropic presentó Fable como una versión pública y limitada de Mythos, su modelo más avanzado para ciberseguridad.
  • Investigadores y profesionales del sector afirman que Fable rechaza incluso tareas inocuas, como revisar código o leer un blog técnico.
  • La compañía también exige aplicar a un programa de verificación para obtener menos limitaciones en trabajos de seguridad.

 


Anthropic lanzó el martes su nuevo modelo Fable, presentado como una versión pública y limitada de Mythos, su sistema más potente y promocionado para tareas de ciberseguridad. Sin embargo, la recepción inicial en parte de la comunidad técnica no ha sido positiva, ya que varios investigadores y profesionales del área sostienen que las restricciones incorporadas son demasiado rígidas y, en algunos casos, erráticas.

De acuerdo con la información reportada por TechCrunch, Fable fue diseñado con barreras específicas para reducir el riesgo de que el modelo pueda utilizarse en el desarrollo de malware o para comprometer software. La empresa también incorporó restricciones relacionadas con biología, debido a preocupaciones similares sobre la posible creación de armas biológicas con ayuda de sistemas de inteligencia artificial avanzados.

El problema, según varias voces del sector, es que esas salvaguardas no solo frenan pedidos potencialmente peligrosos, sino también solicitudes legítimas y de bajo riesgo. Esto ha reavivado un debate cada vez más frecuente en la industria de la IA: hasta qué punto un modelo puede ser útil para profesionales de seguridad sin convertirse en una herramienta de abuso.

Valentina “Chompie” Palmiotti, investigadora de seguridad y miembro de IBM X-Force, dijo que Fable “rechaza cualquier solicitud que podría estar tangencialmente relacionada con la ciberseguridad”. Según su descripción, incluso tareas inocuas como leer una publicación de blog pueden activar los bloqueos del sistema.

Cuando un mensaje activa esas restricciones, Fable detiene la conversación y muestra una advertencia indicando que sus “medidas de seguridad marcaron este mensaje para temas de ciberseguridad o biología”. Ese comportamiento, pensado para reducir riesgos, es precisamente lo que varios expertos cuestionan por su falta de precisión.

Matt Suiche, veterano del sector y miembro del personal técnico en la startup de ciberseguridad basada en IA Tolmo, también criticó el funcionamiento del modelo. Según explicó, “si le pides que escriba código seguro, asume que es un trabajo relacionado con la ciberseguridad en lugar de buenas prácticas de ingeniería de software, y te degradan”.

Ese último punto resulta clave para entender la molestia de parte de la comunidad. En lugar de responder con Fable, el sistema está programado para volver a Claude Opus 4.8 cuando detecta una solicitud que considera sensible. Para usuarios técnicos, eso supone perder acceso a las capacidades específicas que precisamente buscaban probar.

Suiche añadió que el sistema “parece que se basa en palabras clave, así que cualquier cosa en el campo léxico de ‘ciberseguridad’ activa las restricciones”. Aun así, matizó su crítica y consideró comprensible la cautela de Anthropic en esta etapa temprana del despliegue.

Un lanzamiento limitado que sigue generando fricción

Cuando Anthropic presentó Mythos en abril, el acceso al modelo quedó limitado a un número reducido de empresas y organizaciones dentro de lo que la compañía llamó Proyecto Glasswing. La iniciativa fue descrita como un esfuerzo para desplegar el modelo en la protección de software e infraestructura crítica.

La semana pasada, Anthropic amplió el acceso a Mythos a cientos de organizaciones en 15 países. Ese movimiento sugirió un intento de escalar gradualmente una tecnología sensible, manteniendo al mismo tiempo controles de acceso sobre quiénes pueden usarla y con qué fines.

Fable apareció ahora como una alternativa más abierta, aunque claramente recortada frente a Mythos. La reacción de los investigadores deja ver un problema habitual en este tipo de lanzamientos: si el modelo público es demasiado restrictivo, termina siendo menos útil para los profesionales honestos, sin que eso garantice necesariamente que los actores maliciosos queden del todo excluidos.

Otro investigador se quejó públicamente de que incluso pedir una revisión de código activa las restricciones de Fable. Ese tipo de ejemplo amplifica la percepción de que el filtro estaría afectando tareas comunes de ingeniería de software, no solo operaciones ofensivas o delicadas en seguridad informática.

Anthropic no respondió de inmediato a una solicitud de comentarios sobre estas críticas. Esa ausencia de respuesta deja sin aclarar, al menos por ahora, si la empresa planea ajustar rápidamente el comportamiento del modelo o si mantendrá una postura conservadora mientras recopila retroalimentación de los usuarios.

El dilema entre utilidad y seguridad en la IA

La controversia alrededor de Fable encaja en una discusión más amplia sobre los llamados modelos de frontera. Estas plataformas prometen capacidades avanzadas para automatizar análisis, revisar código, detectar vulnerabilidades y acelerar tareas complejas. Pero al mismo tiempo, también pueden emplearse para fines dañinos si no existen límites claros.

En ciberseguridad, ese equilibrio es especialmente delicado. Un mismo conocimiento técnico puede servir para defender sistemas o para atacarlos. Por eso, muchas empresas de IA intentan diferenciar entre usuarios confiables y solicitudes riesgosas, aunque en la práctica esa separación suele ser difícil de aplicar con precisión.

Suiche señaló que es preferible “captar a más personas que a menos” cuando se hace un lanzamiento de este tipo, y luego relajar las restricciones con el tiempo. En su opinión, Anthropic y otras compañías de modelos avanzados todavía están afinando sus medidas y probablemente evolucionarán a medida que colaboren más con una nueva generación de startups de ciberseguridad.

Ese comentario muestra que, incluso entre los críticos, hay cierto reconocimiento de que las empresas de IA operan en un terreno incierto. La presión regulatoria, el riesgo reputacional y la posibilidad de abuso empujan a adoptar guardrails más agresivos, aunque eso termine generando fricción con usuarios legítimos.

El caso también recuerda que los modelos de IA no se evalúan solo por su potencia, sino por la calidad de su calibración. Si las restricciones son demasiado laxas, la empresa asume mayores riesgos. Si son excesivas, el producto puede perder atractivo para los profesionales que más podrían beneficiarse de sus funciones especializadas.

Programas de acceso verificado y un patrón que se repite

Más allá de las barreras integradas en el propio modelo, Anthropic exige que los profesionales de ciberseguridad apliquen al Programa de Verificación Cibernética. Quienes son aceptados obtienen menos limitaciones para utilizar Claude en trabajos relacionados con seguridad.

Este enfoque no es exclusivo de Anthropic. OpenAI cuenta con un esquema similar, denominado Acceso Confiable para Ciberseguridad. La existencia de programas de este tipo sugiere que los principales desarrolladores de IA están convergiendo hacia un modelo de acceso escalonado, donde las capacidades más delicadas quedan reservadas para usuarios evaluados previamente.

Para el sector, el reto no es solo crear programas de verificación, sino hacer que el acceso sea útil y razonablemente predecible. Si la experiencia pública está demasiado limitada y la vía verificada resulta lenta o cerrada, muchos investigadores podrían optar por herramientas alternativas o simplemente considerar que el producto no responde a sus necesidades reales.

En el corto plazo, la discusión sobre Fable ofrece una señal importante para toda la industria. La promesa de usar IA avanzada para reforzar la seguridad de software e infraestructura crítica es atractiva, pero su ejecución depende de un equilibrio fino entre protección, confianza y funcionalidad. Por ahora, Anthropic enfrenta una respuesta clara de parte de varios especialistas: la prudencia puede ser necesaria, pero si se aplica con demasiada amplitud, también puede terminar desactivando el valor del propio producto.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín