O Novo Xerife de IA Lança um Desafio ao Google

O CEO da Cloudflare, Matthew Prince, não fez seu maior anúncio sobre IA em um comunicado à imprensa ou chamada de resultados. Ele fez isso uma resposta no X (antigo Twitter) de cada vez.

No início deste mês, a Cloudflare lançou o que chamou de “Dia da Independência do Conteúdo”, uma mudança de política que bloqueia empresas de IA de extrair dados dos sites que protege, a menos que compensem os criadores de conteúdo. A mudança desafia a economia da web, que existe há décadas, onde empresas como o Google podiam indexar livremente conteúdos em troca de tráfego, e a substitui por um novo padrão muito mais rigoroso: nada de rastreamento sem um acordo.

Mas a verdadeira história é o que aconteceu depois.

Em uma série de respostas sem filtro no X ao longo de vários dias, Prince revelou que a Cloudflare já está tratando alguns gigantes da IA como violadores, sinalizando uma mudança dramática de poder em quem define as regras da web.

Uma das admissões mais notáveis? “O Gemini está bloqueado por padrão”, escreveu Prince em 3 de julho, referindo-se ao modelo de IA do Google. Em outras palavras, os agentes de IA do Google não são mais bem-vindos para ingerir dados livremente de sites protegidos pela Cloudflare, a menos que o Google cumpra as novas regras ou pague.

Isso é um grande problema. A Cloudflare protege cerca de 20% da web, incluindo grandes editores, meios de comunicação e plataformas de criadores. Se cortar os crawlers de IA desses sites, os grandes modelos de linguagem que alimentam os chatbots de hoje, resumos de IA e caixas de respostas podem ficar sem alimento.

Um ponto de discórdia importante para os editores tem sido o Googlebot, o principal crawler do Google, que tradicionalmente indexava conteúdos para busca. Agora, o Googlebot também é usado para alimentar dados para os modelos de IA do Google, incluindo suas novas Visões de IA e o LLM Gemini (Modelo de Linguagem Grande) que alimenta muitos de seus recursos de IA generativa. Esse papel duplo cria um conflito de interesse para os criadores que desejam aparecer nos resultados de busca tradicionais, mas não ter seu conteúdo usado para treinamento de IA sem compensação.

Prince deixou claro que as práticas atuais do Google não serão permitidas sob os antigos termos. “Faremos com que o Google forneça maneiras de bloquear a Caixa de Resposta e a Visão de IA, sem bloquear a indexação clássica de busca, também”, escreveu ele. Se não? “Temos várias outras maneiras de forçá-los a isso.”

Tradução: A Cloudflare, uma empresa outrora conhecida por proteger sites de ataques DDoS, agora se vê como um guardião da economia da IA, e não tem medo de mostrar sua força.

O Gemini está bloqueado por padrão. Faremos com que o Google forneça maneiras de bloquear a Caixa de Resposta e a Visão de IA, sem bloquear a indexação clássica de busca.

— Matthew Prince 🌥 (@eastdakota) 3 de julho de 2025

Mas um usuário contestou a viabilidade técnica disso: “É possível? As visões de IA não são uma representação do próprio ranking do índice de busca – não é a maior parte rag?” “Rag” refere-se a Geração Aumentada por Recuperação, onde os LLMs puxam de dados indexados. A resposta curta e confiante de Prince: “É. #aguardem.” Essa hashtag sugere que a Cloudflare acredita ter as habilidades técnicas para separar resumos e recursos impulsionados por IA da indexação de busca padrão, algo que o Google, até agora, não tem se mostrado disposto ou capaz de oferecer aos editores.

É. #aguardem

— Matthew Prince 🌥 (@eastdakota) 3 de julho de 2025

O tom de Prince é diplomático, mas inegavelmente firme. Ele diz que está “encorajado pelas conversas com eles”. Mas ele também sugere ferramentas de aplicação se a Big Tech não cooperar.

“No pior cenário, passaremos uma lei em algum lugar que exige que eles separem seus crawlers e então anunciem todas as rotas para seus crawlers a partir daí. E isso não seria difícil. Mas estou esperançoso de que não precisará chegar a isso”, disse ele em outra postagem.

No pior cenário, passaremos uma lei em algum lugar que exige que eles separem seus crawlers e então anunciem todas as rotas para seus crawlers a partir daí. E isso não seria difícil. Mas estou esperançoso de que não precisará chegar a isso.

— Matthew Prince 🌥 (@eastdakota) 7 de julho de 2025

A ideia de que o Google seja “forçado” a se adaptar é uma declaração poderosa vinda de uma empresa que não dita padrões web, mas controla efetivamente uma parte significativa do seu tráfego. A confiança de Prince destaca a vantagem única da Cloudflare.

Prince não está sozinho em soar o alarme. Um usuário do X perguntou sobre bloquear o crawler de IA da Amazon, Nova. Prince respondeu reconhecendo “conflitos de interesse com os hyperscalers e seus esforços de IA”, uma referência ao fato de que empresas como Amazon, Google e Microsoft operam tanto serviços de IA quanto enormes infraestruturas de backbone.

Os comentários de Prince vão além do que a maioria dos CEOs de tecnologia se atreveram. Enquanto outros emitem apelos vagos por “segurança em IA” ou “licenciamento justo”, ele está delineando os próximos passos. Primeiro: parar os crawlers. Segundo: construir um mercado onde os motores de IA paguem os criadores não por tráfego, mas por valor, ou quão bem seu conteúdo preenche lacunas de conhecimento em modelos de IA. Pense nisso como SEO para a web pós-busca.

Falando tecnicamente, a Cloudflare pode aplicar essas regras identificando agentes de usuário de IA, basicamente os rótulos de software que os crawlers usam, e bloqueando-os automaticamente, a menos que sejam permitidos. Por exemplo, pode bloquear Gemini (Google), Claude (Anthropic) e ChatGPT (OpenAI) de acessar conteúdo, a menos que um editor explicitamente os inclua na lista de permissões.

Não é um sistema perfeito – as empresas podem se passar por crawlers, e nem todos os bots se identificam – mas é um sinal poderoso. E com bilhões de páginas sob sua supervisão, a Cloudflare está agora em uma posição única para moldar o futuro dos dados de treinamento de IA, uma regra de firewall por vez.

As postagens de Prince revelam que as regras de engajamento estão mudando em tempo real. As empresas de IA, uma vez acostumadas a absorver silenciosamente a web, podem em breve precisar negociar publicamente, de forma transparente e em termos amigáveis aos criadores.

Em resumo: a Cloudflare quer proteger a própria ideia de que o conteúdo tem valor. Pense na Cloudflare como um enorme, inteligente segurança e serviço de entrega expressa para seu site. Quando alguém tenta acessar seu site, seu pedido geralmente passa primeiro pela rede global da Cloudflare. A Cloudflare pode então bloquear tráfego malicioso, acelerar a entrega de conteúdo e, crucialmente, identificar e controlar tipos específicos de bots automatizados, como crawlers de IA, antes que cheguem ao servidor real do seu site. Na crescente corrida armamentista da IA, isso torna a Cloudflare um dos guardiões mais importantes da internet.

Fonte

Compartilhe esse conteúdo: