Por Canuto  

Cloudflare anunció un cambio que puede alterar la relación entre editores y empresas de inteligencia artificial. Desde septiembre de 2026, la firma bloqueará por defecto a rastreadores de uso mixto en páginas con anuncios y empujará a los desarrolladores de IA a separar búsqueda, agentes y entrenamiento, mientras expande modelos para que los medios cobren por el valor generado con su contenido.
***

  • Cloudflare bloqueará por defecto, desde el 15 de septiembre de 2026, rastreadores de uso mixto en páginas con anuncios.
  • La medida busca separar el rastreo para búsqueda tradicional del uso para agentes de IA y entrenamiento de modelos.
  • La empresa también impulsa esquemas de pago como Pay Per Use para que los editores cobren cuando su contenido genere valor.

 


Cloudflare anunció una nueva política que eleva la presión sobre las empresas de inteligencia artificial que dependen del contenido abierto de la web. La medida apunta a separar de forma explícita el rastreo para motores de búsqueda tradicionales del rastreo destinado a agentes de IA y entrenamiento de modelos.

Según informó TechCrunch, a partir del 15 de septiembre de 2026 la configuración predeterminada de Cloudflare bloqueará a los rastreadores de “uso mixto” en cualquier página que aloje anuncios. En la práctica, eso significa que los bots que mezclen búsqueda, uso de agentes y entrenamiento quedarán bloqueados por defecto, salvo que el propietario del sitio cambie la configuración.

El cambio no será marginal dentro del ecosistema de Cloudflare. La empresa dijo que estas nuevas configuraciones se aplicarán a nuevos clientes, a nuevos sitios creados por clientes ya existentes y también a todos los clientes gratuitos que ya usan la plataforma.

La relevancia del anuncio va más allá de una simple preferencia técnica. Si Cloudflare logra imponer esta separación de usos, los proveedores de modelos de IA podrían ver restringido el acceso automático al contenido web que hoy utilizan para entrenar sistemas o alimentar servicios de respuesta y navegación asistida.

El trasfondo es económico y también político. Los editores quieren seguir siendo visibles en buscadores y, cada vez más, en servicios de IA, pero al mismo tiempo buscan evitar que su propiedad intelectual se use sin compensación.

Una línea más dura contra el rastreo de uso mixto

Cloudflare sostuvo que la mayoría de los propietarios de sitios no quiere desaparecer de internet ni dejar de ser descubierta por motores de búsqueda. Lo que sí quiere, según la compañía, es contar con protecciones más claras para que ese descubrimiento no implique regalar contenido para fines de IA.

En su anuncio, la empresa mencionó de forma indirecta al “motor de búsqueda más grande del mundo”. La referencia apunta claramente a Google, al que Cloudflare atribuye acceso a cerca de “2x más información” que otras firmas de IA por la dificultad que tendrían los clientes para seguir siendo descubribles sin exponer su material a usos de inteligencia artificial.

Esa afirmación no ha pasado sin respuesta en debates previos del sector. Google ha rechazado esa generalización y ha recordado que ofrece un bot llamado Google Extended, con el que los propietarios de sitios pueden excluir su contenido del entrenamiento y de productos y servicios de IA como Gemini Apps y Vertex API.

Sin embargo, el punto más sensible no está solo en esa herramienta opcional. El Googlebot, que sigue siendo la insignia del grupo, rastrea para la búsqueda e incluye funciones de IA como AI Overviews y AI Mode.

Ese solapamiento entre búsqueda e IA es precisamente lo que Cloudflare busca atacar con su nueva política predeterminada. Al obligar a separar usos, la empresa quiere que los actores del mercado definan con más transparencia para qué recolectan información y bajo qué condiciones económicas lo hacen.

El argumento de fondo: una web dominada por tráfico no humano

Matthew Prince, cofundador y CEO de Cloudflare, enmarcó la decisión dentro de una transformación más amplia del tráfico en internet. El ejecutivo dijo que, ahora que la mayoría del tráfico online ya no es humano, hace falta actuar con mayor rapidez para construir un ecosistema sostenible.

Ese comentario alude a un hito reciente citado por la compañía. Por primera vez, los bots superaron al tráfico humano en la red, un cambio que no se esperaba sino hasta el próximo año.

La lectura de Cloudflare es que este nuevo equilibrio altera los incentivos de toda la web. Si los robots consumen más recursos que las personas y lo hacen para usos comerciales de terceros, el modelo abierto de publicación digital empieza a tensarse.

Prince también defendió el enfoque como una forma de mejorar la visibilidad y las oportunidades comerciales para los dueños de sitios. A la vez, dijo que el esquema beneficiará a las empresas de IA cuyos bots tengan intenciones claras y transparentes.

La señal para el mercado es concreta. Cloudflare espera que sus nuevos ajustes por defecto empujen a los rastreadores de uso mixto a separar la búsqueda del uso para agentes y del entrenamiento.

De bloquear bots a cobrar por el valor generado

La compañía no está entrando en este debate desde cero. Aunque Cloudflare ofrece productos para ayudar a usuarios y empresas a desplegar sus propios sistemas de IA, también ha venido lanzando herramientas para dar a los editores más control sobre cómo se usa su contenido en esta nueva etapa de internet.

En los últimos años, la firma presentó mecanismos para combatir bots de IA. Entre ellos figura un mercado llamado Pay Per Crawl, pensado para que los sitios web puedan cobrar a los bots por rastrear sus páginas.

Ahora ese enfoque está evolucionando. Cloudflare dijo que Pay Per Crawl pasará a convertirse en “Pay Per Use”, un esquema que permitirá a los editores cobrar cuando su contenido genere valor, y no solo cuando sea extraído por un bot.

El cambio es importante porque ataca una queja central de la industria editorial. Muchos medios no solo cuestionan que su material sea copiado o resumido, sino que además consideran insuficiente cobrar solo por el acceso técnico si el verdadero beneficio económico aparece después, cuando el contenido alimenta respuestas o resultados automatizados.

Cloudflare plantea así un modelo más cercano a una licencia de explotación que a una simple tarifa de acceso. Para los desarrolladores de IA, eso puede traducirse en mayores costos, pero también en reglas más definidas para negociar con quienes producen información original.

Menos desperdicio de ancho de banda y primeros socios del modelo

La empresa también argumentó que su propuesta puede reducir costos operativos para los propios editores. De acuerdo con datos internos de Cloudflare, más del 50% del tráfico de rastreo proveniente de rastreadores de IA se dedica a volver a obtener páginas que no han cambiado.

Esa práctica consume ancho de banda y capacidad de cómputo sin aportar nuevo valor al sitio. En un contexto donde muchos medios operan con márgenes ajustados, ese uso repetitivo de infraestructura se convierte en otro frente de fricción con la industria de IA.

Para poner en marcha el nuevo modelo, Cloudflare está trabajando inicialmente con dos socios: Ceramic.ai y You.com. El experimento sirve como primera prueba concreta para ver si un sistema de compensación por uso puede funcionar a escala comercial.

Cuando un editor decide participar, recibe pago si su contenido aparece en los resultados de búsqueda de IA de Ceramic. También puede cobrar cuando You.com accede a una pieza de su contenido premium.

Cloudflare añadió que otras empresas de IA podrán personalizar el modelo según su forma de operar. Eso sugiere que no habrá una única tarifa universal, sino acuerdos adaptables según el tipo de producto, el modo de consumo del contenido y la clase de valor que se genere.

Qué implica este movimiento para la industria de IA y para los medios

La decisión de Cloudflare puede alterar una parte sensible de la cadena de suministro de datos para la inteligencia artificial. Si más infraestructura web adopta bloqueos por defecto y exige separar funciones, las compañías de IA tendrán que volverse más explícitas sobre cómo recogen información y para qué la usan.

Eso podría favorecer a los actores con acuerdos de licencia ya establecidos y complicar a quienes dependen de scraping amplio y ambiguo. También puede abrir una ventaja competitiva para bots que declaren con precisión si solo indexan para búsqueda o si persiguen objetivos de entrenamiento y automatización.

Para los medios y creadores, el cambio representa una herramienta adicional, no una solución total. La política predeterminada de Cloudflare amplía el margen de decisión, pero cada editor seguirá enfrentando el dilema entre maximizar alcance, preservar ingresos y negociar desde una posición de poder desigual frente a grandes plataformas tecnológicas.

También hay un ángulo regulatorio y de mercado que seguirá creciendo. A medida que los sistemas de IA integran respuestas directas, resúmenes y agentes capaces de actuar sobre información publicada por terceros, la disputa por remuneración y consentimiento ya no parece un tema periférico, sino estructural.

Por ahora, Cloudflare ha trazado una línea clara para septiembre de 2026. Si la medida gana tracción, la web podría entrar en una fase donde el acceso automatizado al contenido deje de asumirse como gratuito y pase a negociarse como un insumo económico con reglas más estrictas.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín