Por Canuto  

Cloudflare fijó un ultimátum para los rastreadores de inteligencia artificial: desde el 15 de septiembre, bloqueará por defecto a los bots que intenten usar páginas con anuncios para entrenamiento o agentes de IA, salvo autorización expresa del dueño del sitio. La medida apunta a redefinir cómo la industria de IA accede al contenido que sostiene la web abierta.

***

  • Cloudflare bloqueará desde el 15 de septiembre a rastreadores de IA en páginas con anuncios, salvo consentimiento del editor.
  • La regla también alcanza a bots de uso mixto que combinan búsqueda, entrenamiento y agentes en un mismo rastreador.
  • La empresa impulsa un modelo de “pagar por uso” para compensar a editores cuando su contenido influya en respuestas de IA.

 


Cloudflare fija un límite para los rastreadores de IA

Cloudflare anunció un cambio de fondo en la forma en que permitirá el acceso de bots de inteligencia artificial al contenido alojado detrás de su infraestructura. La empresa dijo que, a partir del 15 de septiembre, bloqueará por defecto a los rastreadores de IA en páginas que contengan publicidad.

La decisión no implica un cierre total de los sitios frente a los motores de búsqueda tradicionales. Según explicó la compañía, los nuevos sitios seguirán permitiendo la indexación para búsqueda, pero negarán el acceso al entrenamiento de IA y a los agentes automatizados cuando el contenido monetice mediante anuncios.

Ese nuevo ajuste aplicará a nuevos clientes, a nuevos sitios creados por clientes ya existentes y también a usuarios gratuitos que no hayan modificado su configuración. Los propietarios de los sitios conservarán la opción de reactivar el acceso desde su panel de control, pero el punto de partida ya no será la apertura automática.

En la práctica, Cloudflare está cambiando la lógica del consentimiento. El contenido que genera ingresos por publicidad quedará fuera del alcance de la IA, a menos que el dueño del sitio decida expresamente permitir ese uso.

La medida alcanza también a los llamados rastreadores de uso mixto. Esos bots combinan funciones de búsqueda, entrenamiento de modelos y operación de agentes de IA en una misma herramienta, lo que para muchos editores dificulta distinguir qué uso se hace realmente de sus páginas.

Si un rastreador no ofrece al editor una manera de separar esos distintos usos, Cloudflare indicó que lo bloqueará en las páginas con anuncios. Esa condición introduce una presión técnica directa sobre empresas que hoy reutilizan un solo bot para varias tareas comerciales.

El trasfondo económico detrás del bloqueo

Cloudflare justificó la decisión con una cifra que considera decisiva para el equilibrio de la web. La empresa aseguró que los bots automatizados ya generan más de la mitad de todo el tráfico de Internet, un umbral que, según su visión, llegó antes de lo esperado.

El director ejecutivo Matthew Prince sostuvo que la mayor parte del tráfico de Internet ya no es humana. Bajo esa lectura, la compañía considera que la infraestructura de la red debe adaptarse con más rapidez para evitar que el ecosistema de publicación se deteriore aún más.

El problema para los editores no es solo técnico, sino económico. Muchos sitios necesitan aparecer en respuestas de IA del mismo modo en que durante años dependieron de figurar bien posicionados en los motores de búsqueda.

Sin embargo, ese mismo proceso de rastreo puede alimentar modelos que luego responden directamente a los usuarios sin devolverles la visita al medio original. Cuando eso ocurre, el editor pierde la oportunidad de monetizar con tráfico, anuncios o suscripciones.

Cloudflare subrayó ese dilema al apuntar al “motor de búsqueda más grande del mundo”, en una referencia evidente a Google. Según la empresa, Googlebot combina indexación para búsqueda con entrenamiento de IA, lo que le daría a Google cerca del doble de acceso a datos frente a competidores centrados solo en IA.

Para muchos sitios, bloquear ese tipo de bot supone un costo delicado. Si un editor niega el acceso, corre el riesgo de reducir su visibilidad en búsqueda, algo que puede traducirse en menos lectores y menos ingresos.

El mismo dilema, de acuerdo con el reporte original de The Next Web, también se extiende a Bing de Microsoft y a Applebot de Apple. La fricción ya no es solo entre editores y startups de IA, sino entre medios y grandes plataformas que concentran distribución y extracción de datos.

De pagar por rastrear a pagar por uso

El bloqueo por defecto no es el único cambio en la estrategia de Cloudflare. La compañía también está transformando su esquema previo de “Pagar por Rastrear” hacia un sistema que llama “Pagar por Uso”.

La diferencia es relevante para los editores. En lugar de recibir una compensación solo porque un bot descargó su contenido, la nueva idea consiste en pagar cuando ese material contribuya efectivamente a construir una respuesta generada por IA.

Cloudflare señaló que los primeros socios en este esquema son Ceramic.ai y You.com. Con ello, la empresa intenta mostrar que ya existe una vía inicial para vincular el uso de contenido con una forma concreta de remuneración.

Además, la firma añadirá un panel para que los editores vean qué bots usan su trabajo y cuánto tráfico devuelven esas compañías a cambio. Ese punto busca hacer visible una relación que hasta ahora ha sido opaca para una parte importante de los propietarios de sitios.

Cloudflare incluso le dio un nombre al nuevo terreno competitivo: Optimización para Motores de Respuesta. La expresión retrata una evolución del SEO tradicional hacia un escenario donde las marcas y medios ya no solo buscan clics en buscadores, sino presencia dentro de asistentes y chatbots.

Esa transición no ocurre en el vacío. En el mercado ya han surgido startups que venden herramientas para mejorar la visibilidad de empresas y marcas en respuestas de IA, bajo la idea de que el posicionamiento conversacional podría convertirse en una nueva capa crítica de distribución digital.

Con esta apuesta, Cloudflare intenta ocupar una posición estratégica en la infraestructura que conectará a editores, plataformas de IA y mecanismos de compensación. En otras palabras, no solo quiere filtrar el tráfico, sino también administrar las reglas del intercambio económico que podría emerger alrededor de él.

La presión sobre la web abierta y los límites de la medida

El contexto de fondo es cada vez más preocupante para los medios y sitios financiados con publicidad. Las respuestas generadas por IA están reduciendo los clics que históricamente sostuvieron buena parte de la web abierta.

Cuando un usuario obtiene una respuesta dentro de Google o dentro de un chatbot, a menudo ya no necesita visitar la página que produjo la información original. Eso rompe el flujo que durante años financió redacciones, blogs especializados y portales temáticos.

Un estudio de campo citado en la cobertura encontró que los Resúmenes AI de Google redujeron los clics salientes en alrededor de un 40 por ciento. La cifra refuerza el temor de que el valor económico del contenido siga desplazándose desde los creadores hacia las plataformas que intermedian la respuesta.

Incluso economistas han empezado a modelar escenarios de colapso de la web abierta si ese arreglo no se corrige. La preocupación es que, si producir información deja de ser rentable, terminará debilitándose la base misma que hoy nutre a los sistemas de IA.

Aun así, no está claro que una sola empresa pueda corregir un problema de esa escala. El reporte indica que Google y Apple ya ofrecen rastreadores de exclusión que podrían eludir el bloqueo de Cloudflare, mientras otros competidores podrían intentar rutas similares.

Esa limitación revela una tensión estructural del momento actual. Quien controla parte importante de la infraestructura web puede imponer reglas, pero no necesariamente tiene poder suficiente para obligar a toda la industria de IA y búsqueda a aceptar una nueva economía del contenido.

En paralelo, los reguladores también están avanzando por otros caminos. En Reino Unido, las autoridades están obligando a Google a permitir que los editores se excluyan de la búsqueda con IA sin perder su posicionamiento general en resultados tradicionales.

Por otra parte, varios editores de noticias han llevado a OpenAI a los tribunales por el uso de sus materiales para entrenamiento. Ese frente legal muestra que la disputa por datos, licencias y atribución ya se está resolviendo a la vez en infraestructura, regulación y litigios.

Una señal para gigantes de búsqueda e IA

La decisión de Cloudflare destaca por su agresividad frente a intentos previos de equilibrar esta relación. Más que una advertencia simbólica, introduce una fecha específica y una consecuencia técnica clara para los rastreadores que no separen búsqueda de entrenamiento o de funciones de agente.

La cobertura de NBC News resumió la tensión con una fórmula directa: separar búsqueda o ser bloqueado. Esa síntesis captura el núcleo del mensaje que Cloudflare está enviando a empresas de IA, buscadores y proveedores de agentes automatizados.

Para los gigantes tecnológicos, el plazo del 15 de septiembre puede funcionar como una prueba de hasta dónde están dispuestos a ceder en transparencia operativa. Si adaptan sus bots para diferenciar funciones, podrían preservar acceso; si no lo hacen, enfrentarán más fricción con los editores.

Para los dueños de sitios, la medida representa una nueva herramienta de negociación en un entorno donde hasta ahora la asimetría ha sido enorme. Por primera vez, una compañía con presencia en una gran porción del tráfico global busca volver restrictivo, y no automático, el acceso de la IA a contenidos monetizados.

Queda por ver si esa estrategia logra alterar el comportamiento de Google, Microsoft, Apple y firmas centradas en IA generativa. También falta saber si los editores preferirán bloquear, licenciar o experimentar con modelos híbridos a cambio de visibilidad y pagos futuros.

Lo que ya parece claro es que la discusión dejó de ser abstracta. El conflicto sobre quién captura el valor del contenido en la era de la IA ahora tiene fecha, infraestructura, incentivos económicos y un nuevo campo de batalla en la capa más básica de la web.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público

Este artículo fue escrito por un redactor de contenido de IA

 


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín