Por Canuto  

Un nuevo trabajo académico examina uno de los dilemas más incómodos de la era de la inteligencia artificial: si el mundo intentara frenar temporalmente el desarrollo de sistemas de superinteligencia, ¿cómo podría comprobar que gobiernos, laboratorios y científicos realmente obedecen? El estudio no define qué investigación debería prohibirse, pero sí ordena el problema y propone 28 mecanismos de verificación que van desde denunciantes e inspecciones internacionales hasta revisión automatizada de código y monitoreo de chips.
***

  • El estudio analiza cómo verificar restricciones internacionales sobre investigación de IA de frontera sin asumir confianza entre países.
  • Los autores identifican 28 mecanismos potenciales, entre ellos denunciantes, inteligencia, órdenes de registro, auditorías y revisión automática de código.
  • La mayor preocupación son los centros de datos secretos y la futura automatización de la investigación por sistemas de IA.


La discusión sobre una posible pausa o freno internacional al desarrollo de inteligencia artificial avanzada suele concentrarse en la política y en la seguridad. Sin embargo, hay una pregunta más operativa que podría definir si cualquier acuerdo sirve o fracasa: cómo verificar que las partes realmente cumplan.

Ese es el eje central de Verifying Restrictions on Frontier AI Research, trabajo de Aaron Scher, del equipo de gobernanza técnica del Machine Intelligence Research Institute en Berkeley, Estados Unidos. El documento estudia cómo podrían verificarse restricciones a la investigación en IA de frontera, sin tomar postura sobre qué líneas concretas deberían prohibirse.

El punto de partida es el temor, defendido por algunos investigadores y organizaciones, de que el desarrollo prematuro de una superinteligencia artificial podría implicar riesgos catastróficos para la humanidad. Desde esa base, el texto explora qué herramientas serían necesarias si varios países firmaran un acuerdo para congelar o limitar ese avance hasta que existan condiciones de seguridad más robustas.

La lógica del análisis es sencilla, aunque sus implicaciones son profundas. Si el progreso en IA depende de cómputo, algoritmos y datos, un alto duradero no podría enfocarse solo en chips o potencia computacional, porque los avances algorítmicos o de datos podrían compensar parte de esas limitaciones.

Por eso, Scher sostiene que una arquitectura de control creíble tendría que incluir restricciones a cierto tipo de investigación. Y, dado el bajo nivel de confianza internacional en temas estratégicos, los firmantes querrían mecanismos para verificar el cumplimiento, no solo promesas políticas.

Un problema de gobernanza que va mucho más allá de los chips

El trabajo toma como referencia un borrador previo de acuerdo internacional para impedir la creación prematura de superinteligencia artificial. Ese esquema, citado por el autor, se apoya en dos pilares: controles sobre chips y restricciones a la investigación.

La idea de fondo es que ninguno de esos pilares bastaría por sí solo. Si solo se vigila el cómputo, la investigación podría seguir empujando la frontera mediante mejores algoritmos o mejores datos de entrenamiento.

Esa observación es relevante para cualquier lector que venga del mundo cripto o de mercados tecnológicos. Igual que en blockchain la capacidad de una red no depende de un solo componente, en IA el avance tampoco responde a una única variable que pueda cerrarse con una sola regla.

El documento usa el término “investigación restringida” para referirse a investigación que un acuerdo internacional prohibiría porque mejora capacidades de IA o porque amenaza el propio sistema de verificación. Entre los ejemplos que menciona están la investigación en capacidades de IA de propósito general y, potencialmente, métodos de entrenamiento descentralizado.

El autor aclara que no intenta decidir qué debe entrar en esa categoría. Su interés está en otra capa del problema: qué tan verificables serían esas restricciones y qué instrumentos concretos podrían usar gobiernos e inspectores para detectar violaciones.

Qué hace difícil verificar una prohibición de investigación

Una de las primeras conclusiones del estudio es que buena parte de las ideas nuevas en aprendizaje automático necesita cómputo para ser probada. Según el análisis citado de Patrick Barnett sobre innovaciones usadas en Llama 3 y DeepSeek-V3, cerca de la mitad de esas mejoras se desarrollaron con menos de 8 equivalentes de H100.

El mismo trabajo traduce esa escala a alrededor de 1 × 10²¹ FLOP en cómputo total. Eso supera lo que posee un usuario promedio, pero seguiría siendo lo bastante pequeño como para resultar efectivamente indetectable con los mecanismos conocidos hoy, según el documento.

Al mismo tiempo, validar ideas a gran escala requiere bastante más cómputo. El texto recoge la visión de actores de la industria que sostienen que muchas propuestas funcionan en pruebas pequeñas, pero fallan al escalar, por lo que las líneas realmente prometedoras suelen necesitar experimentos mayores.

Esa distinción importa porque cambia la visibilidad del infractor. Una idea puede nacer en una infraestructura relativamente modesta, pero demostrar que sirve para empujar la frontera técnica puede requerir recursos mucho más notorios y, por tanto, más rastreables.

El estudio también subraya que no está claro públicamente hasta qué punto la investigación de frontera está limitada por cómputo. Esa incertidumbre divide a los analistas y afecta cualquier estrategia regulatoria basada en umbrales de hardware o entrenamiento.

Otro punto clave es el tamaño del grupo humano relevante. Scher estima, apoyándose en trabajos anteriores, que la población de investigadores capaces de empujar la frontera puede estar en el rango de miles o decenas de miles de personas, aunque la cifra depende mucho de cómo se defina ese conjunto.

Si los humanos siguen siendo la pieza central del progreso, eso vuelve más manejable el universo a monitorear. Pero el panorama cambia si los propios sistemas de IA comienzan a automatizar gran parte del trabajo de investigación y desarrollo.

El documento considera plausible que en pocos años la IA haga una porción sustancial, quizá toda, de la investigación en IA. Ese escenario complica la verificación porque los sistemas son copiables, pueden correr en hardware de consumo y son más difíciles de detectar que investigadores humanos.

A la vez, esa automatización podría reducir objeciones legales o éticas a regímenes intensivos de monitoreo. Vigilar a modelos o agentes de software suele generar menos resistencia que vigilar personas, aunque eso no resuelve los riesgos de abuso estatal o corporativo.

Finalmente, el texto argumenta que criminalizar ciertas actividades reduciría mucho la disposición a realizarlas. Como estimación informal, Scher plantea que el esfuerzo agregado dedicado a investigación de frontera podría caer a entre 1% y 10% del nivel previo a un acuerdo, aunque reconoce que se trata de una cifra especulativa.

Los tres tipos de infractores que más preocupan

Para ordenar el problema, el estudio imagina tres actores principales que podrían violar un acuerdo internacional. El primero es un actor estatal encubierto, competente en seguridad, con posibles centros de datos secretos y quizá desconocido para las autoridades verificadoras.

Ese perfil se parece, en la analogía del texto, a un “Proyecto Manhattan” clandestino para lograr superinteligencia artificial. Es el caso más difícil porque combina recursos, secreto y posibles incentivos geopolíticos.

El segundo grupo lo forman organizaciones ya conocidas por las autoridades, como grandes desarrolladores actuales de IA. El paper menciona como ejemplos a OpenAI, Anthropic, DeepSeek y Prime Intellect, no como infractores actuales, sino como organizaciones de alto riesgo por su experiencia y recursos.

En un régimen de restricciones, esas compañías no podrían seguir con investigación de capacidades de frontera, aunque sí podrían realizar otras tareas permitidas, como operar modelos existentes. Por eso, el reto no sería descubrirlas, sino supervisarlas de forma creíble.

El tercer grupo incluye académicos rebeldes y actores con menos recursos. Su progreso, si existiera, probablemente sería más lento y dependería de aportes dispersos o de avances de nuevo paradigma.

La dificultad cambia según el actor. A veces el posible violador ya es conocido y la verificación se parece a una inspección regulatoria; otras veces el reto principal es descubrir que el proyecto existe en primer lugar.

Los mecanismos más directos para encontrar proyectos secretos

El estudio cataloga 28 mecanismos de verificación de alto nivel, agrupados por objetivo. Para proyectos encubiertos, el primer mecanismo destacado son los denunciantes o whistleblowers.

La propuesta es abrir canales seguros, incluso anónimos, para reportar proyectos secretos de IA y, si es posible, crear incentivos fuertes para hacerlo. El trabajo cita como antecedente el programa de denunciantes de la SEC bajo Dodd-Frank, que ha pagado más de USD $2.000 millones desde 2010.

Scher también menciona garantías de asilo, incluso para familiares, como incentivo potencial. La lógica es que un acuerdo internacional no puede depender solo de sensores y software si los propios participantes tienen evidencia interna del incumplimiento.

Otro bloque importante es la inteligencia sobre objetivos de alto riesgo conocidos. Aquí entran herramientas clásicas como inteligencia de señales, vigilancia de comunicaciones, rastreo financiero para detectar alquileres de chips o contrataciones, y fuentes humanas cercanas a investigadores.

El documento separa esa vigilancia de la búsqueda de objetivos desconocidos. En ese segundo caso, los servicios de inteligencia intentarían descubrir individuos u organizaciones que hoy no están en el radar, usando métodos comparables a los empleados en la detección de programas clandestinos de armas de destrucción masiva.

También se incluye la inteligencia de fuentes abiertas. Según el trabajo, algunos infractores podrían dejar pistas públicas, por ideología, vanidad o descuido, ya sea publicando resultados, organizando eventos o mostrando señales indirectas de no cumplimiento.

La lista suma entrevistas a investigadores y funcionarios relevantes. El autor recuerda que acuerdos como la Convención sobre Armas Químicas ya contemplan el derecho de inspectores a entrevistar al personal de instalaciones supervisadas.

Entre los mecanismos más intrusivos están las órdenes de registro e inspecciones internacionales. La idea es permitir allanamientos de propiedades, archivos y computadoras con un diseño institucional que reduzca tanto la indulgencia doméstica como los excesos de autoridades extranjeras.

El texto incluso menciona inspecciones de corto aviso inspiradas en la Convención sobre Armas Químicas. También incluye propuestas menos maduras, como operaciones encubiertas o de trampa para detectar disposición a participar en proyectos prohibidos, y el uso complementario de polígrafos o tecnologías de detección de mentira.

Cómo vigilar a las organizaciones que sí están a la vista

Cuando el riesgo proviene de organizaciones declaradas y conocidas, el estudio se inclina por mecanismos continuos de monitoreo. Uno de los más relevantes es la revisión asistida por IA de código de producción y de investigación.

La propuesta es que sistemas automatizados analicen bases de código, registros experimentales y documentos técnicos para marcar posibles violaciones. El ideal sería que esas herramientas revelen solo hallazgos de cumplimiento, sin exponer secretos comerciales innecesarios a inspectores humanos.

El documento reconoce dos dificultades evidentes. La primera es probar a terceros que la revisión correcta se ejecuta siempre; la segunda es garantizar que los modelos usados para revisar no sean vulnerables a evasión, sabotaje o jailbreaks.

Otra opción es instalar auditores humanos permanentes dentro de organizaciones de alto riesgo. Scher cita como precedente a los inspectores residentes de la Comisión Reguladora Nuclear de Estados Unidos en plantas nucleares.

También figura el software de monitoreo de empleados en dispositivos de trabajo. Eso podría incluir prevención de fuga de datos, registros de actividad y supervisión suficiente para que inspectores verifiquen cumplimiento sin revisar más información de la necesaria.

En paralelo, el texto sugiere pre-registrar planes de investigación para que autoridades los examinen antes de su ejecución. El objetivo sería evitar infracciones accidentales y reducir la negación plausible cuando un actor salta el proceso.

La revisión previa a la publicación es otra pieza. Según el trabajo, ciertos resultados de investigación deberían enviarse primero a la autoridad verificadora para confirmar que no constituyen investigación restringida antes de hacerse públicos.

La lista se completa con atestaciones de cumplimiento firmadas por varios empleados independientes, programas de educación y divulgación para investigadores, conservación obligatoria de registros y, en algunos casos, entornos de trabajo controlados sin dispositivos personales.

El documento añade una idea especialmente interesante: evaluar modelos de IA para detectar ganancias de capacidad que no tengan explicación visible. Si un acuerdo restringe cómputo e investigación, un salto inesperado en capacidades podría señalar que el progreso siguió ocurriendo por alguna vía no declarada.

El frente de los chips y por qué no basta con saber dónde están

Una parte sustancial del estudio se concentra en la verificación del uso de chips ya localizados y monitoreados. El supuesto es que una fracción muy grande del hardware relevante habría sido identificada por el régimen internacional.

Bajo ese escenario, la pregunta deja de ser solo dónde están los chips y pasa a ser qué están haciendo. El documento plantea revisar entrenamientos de IA en clústeres monitoreados para verificar si emplean métodos novedosos y relevantes para la frontera.

Esa idea apunta a un patrón de evasión concreto. Un actor clandestino podría hacer investigación restringida en un centro de datos secreto pequeño y luego intentar usar clústeres legales y mucho más grandes para escalar el resultado.

Si el entrenamiento sobre infraestructura monitoreada se revisa de forma creíble, sería posible detectar la incorporación de algoritmos nuevos surgidos de investigación prohibida. Eso no impediría todo el progreso secreto, pero sí limitaría su capacidad de aprovechar los mayores recursos disponibles legalmente.

El estudio también contempla clasificar contenido de inferencia, incluidos prompts, uso de herramientas y salidas del modelo, para identificar si un sistema se está empleando en investigación restringida. El problema es que usuarios o modelos podrían ofuscar el trabajo y burlar al clasificador.

Otra propuesta es revisar los datos de entrenamiento para encontrar mejoras de datos prohibidas. Aquí entran debates complejos, por ejemplo sobre cuánto dato sintético sería admisible o qué dominios deberían considerarse sensibles.

Además, Scher menciona monitoreo amplio del uso de chips para detectar experimentos restringidos a partir de señales como consumo eléctrico, ancho de banda de memoria o patrón de carga de trabajo. La utilidad de ese método depende mucho de cómo se definan las prohibiciones.

Por último, el paper explora restringir chips para que solo ejecuten modelos aprobados. Esa opción se parece a una lista blanca técnica, aunque el propio autor advierte que hoy es difícil demostrar de forma robusta que un modelo no puede hacer investigación restringida.

No proliferación, riesgos de abuso y la gran conclusión del paper

Más allá de la verificación en sentido estricto, el estudio incluye mecanismos de no proliferación. Entre ellos aparecen impedir el desarrollo de IA capaces de automatizar I+D, frenar la propagación de esos modelos y contener la difusión de algoritmos y datos valiosos.

La lógica es parecida a la de controles sobre software o conocimiento sensible en otras áreas estratégicas. Cuanto menos acceso tengan actores ilícitos a modelos, pesos, algoritmos o conjuntos de datos de alto valor, más difícil sería que sostengan investigación restringida.

Sin embargo, Scher advierte que varias de estas ideas siguen lejos de estar listas para implementarse. En especial, el monitoreo del uso de chips y algunos métodos de verificación técnica todavía requerirían investigación y desarrollo adicional.

La principal conclusión del trabajo es que el reto más difícil sigue siendo el de centros de datos secretos no conocidos por las autoridades. Esos centros podrían servir tanto para experimentar con nuevos métodos como para ejecutar inferencia no monitoreada de modelos capaces de hacer trabajo de I+D.

El autor destaca que, antes de una automatización amplia de la investigación, el progreso ilícito suele requerir tanto expertos humanos como cómputo. Pero si la IA llega a hacer por sí misma la mayor parte del trabajo, el cuello de botella puede reducirse casi solo al acceso a cómputo oculto.

Entre los mecanismos que el texto considera más prometedores sobresalen los denunciantes y la inteligencia para detectar proyectos encubiertos. Para supervisar organizaciones declaradas, el énfasis recae en herramientas automatizadas como revisión de código y monitoreo de inferencia.

Al mismo tiempo, el trabajo advierte sobre un riesgo político evidente. Si estas herramientas se aplican sin salvaguardas adecuadas, podrían derivar en represión política, supresión de investigación legítima, vigilancia excesiva o filtraciones de seguridad.

En ese sentido, el estudio no presenta una solución mágica ni asegura que un acuerdo de este tipo sea fácil de hacer cumplir. Lo que sí aporta es un mapa más concreto del problema y de las piezas que harían falta si la comunidad internacional alguna vez decide que frenar la IA de frontera es una necesidad real y urgente.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín