A Guerra pela Web Começou

Uma guerra de alto risco acaba de eclodir sobre o futuro da internet. De um lado está a Cloudflare, um gigante da infraestrutura web que atua como um guardião de uma grande parte do tráfego online. Do outro lado está a Perplexity, uma estrela em ascensão do mundo da IA, um mecanismo de busca que ameaça derrubar a dominância do Google.

A acusação é explosiva: a Cloudflare afirma que a Perplexity é um ator malicioso, um bot rebelde que ignora as regras mais antigas da internet para secretamente coletar dados de sites que explicitamente pediram para ser deixados em paz. A resposta da Perplexity é igualmente contundente: ela afirma que a Cloudflare está, ou perigosamente incompetente ou engajada em um truque publicitário, compreendendo fundamentalmente mal como a IA moderna funciona.

A rixa é a primeira grande batalha em um conflito que definirá a próxima era da web: quem tem acesso às informações online e quem decide as regras?

A Acusação: Um Bot Rebelde Disfarçado

Por décadas, a internet operou sob um “acordo de cavalheiros” chamado arquivo robots.txt. É um arquivo de texto simples que os proprietários de sites usam para postar um sinal digital de “Não Entre” para rastreadores automatizados ou “bots”. Bots bem-comportados, como os do Google, respeitam esse sinal.

Em um post de blog mordaz, a Cloudflare alega que a Perplexity está ignorando isso. A empresa afirma que, quando seu bot declarado, “PerplexityBot”, é bloqueado, o mecanismo de busca de IA muda para o modo furtivo, usando identidades de navegador genéricas e rotacionando endereços IP para continuar rastreando e coletando dados disfarçado.

A Cloudflare diz que testou isso criando novos sites privados com regras estritas de “nenhum bot permitido”. Apesar disso, descobriram que “a Perplexity ainda estava fornecendo informações detalhadas sobre o conteúdo exato hospedado em cada um desses domínios restritos”. Com base nesse “comportamento de rastreamento furtivo”, a Cloudflare anunciou que agora deslistou a Perplexity como um bot verificado e está bloqueando ativamente seus rastreadores não declarados.

A Réplica: “Você Não Entende Como a IA Funciona”

A resposta da Perplexity foi rápida, acusando a Cloudflare de errar “quase tudo sobre como assistentes de IA modernos realmente funcionam”. A empresa argumenta que não é um “bot” tradicional e que a Cloudflare está aplicando regras antigas a novas tecnologias.

O cerne de seu argumento é a diferença entre um bot e um agente de usuário. Um bot tradicional, como o do Google, rastreia sistematicamente bilhões de páginas para construir um índice massivo para uso posterior. Um agente de usuário, alega a Perplexity, atua em nome de uma pessoa real em tempo real. Quando você faz uma pergunta à Perplexity, seu agente de IA busca as informações necessárias na web naquele momento para responder a você. Não está acumulando dados; está agindo como seu assistente de pesquisa pessoal.

“Isso é fundamentalmente diferente do rastreamento web tradicional em que os rastreadores visitam sistematicamente milhões de páginas para construir bancos de dados massivos, independentemente de alguém ter pedido aquela informação específica ou não”, escreveu a Perplexity em uma resposta detalhada. “Quando empresas como a Cloudflare caracterizam assistentes de IA impulsionados por usuários como bots maliciosos, estão argumentando que qualquer ferramenta automatizada que sirva usuários deve ser suspeita — uma posição que criminalizaria clientes de e-mail e navegadores web.”

Então veio a bombástica contra-acusação. A Perplexity afirma que a Cloudflare “atribuiu fundamentalmente 3-6 milhões de solicitações diárias” de um serviço de navegador em nuvem de terceiros à Perplexity, chamando isso de “uma falha básica de análise de tráfego que é particularmente embaraçosa para uma empresa cujo negócio central é entender e categorizar o tráfego web”. A Perplexity sugere que isso é uma “momento publicitário inteligente” ou um sinal de que a Cloudflare está “perigosamente desinformada sobre os fundamentos da IA”.

Usuários nas redes sociais estavam divididos. “A Perplexity está apenas usando um proxy para buscar algo que já está na web pública, para responder a uma pergunta do usuário. Enquadrá-la como algum tipo de ataque é absurdo. A web pública deve ser pública”, defendeu o fundador de tecnologia Andrej Radonjic. Outro usuário foi mais crítico: “Perplexity, fingindo ser um motor de busca, fingindo ser IA, ainda assim, não é nenhum dos dois.”

Quem Possui a Web Aberta?

Essa rixa pública expõe a tensão central da era da IA. Startups de IA como a Perplexity precisam de acesso ao vasto oceano de dados na web aberta para funcionar e competir com gigantes como Google e OpenAI. Sem isso, não podem fornecer respostas precisas e em tempo real. Mas os proprietários de sites estão se tornando cada vez mais cautelosos em ter seu conteúdo coletado sem consentimento ou compensação para treinar e alimentar esses novos modelos de IA.

A Cloudflare, ao optar por bloquear os rastreadores não declarados da Perplexity, efetivamente se nomeou como a polícia de dados da IA, tomando decisões sobre o que constitui tráfego web “legítimo”. A Perplexity alerta que isso pode levar a uma “internet de dois níveis” onde o acesso depende não das necessidades do usuário, mas se a ferramenta de IA escolhida foi “abençoada pelos controladores da infraestrutura”.

As regras da internet estão sendo reescritas em tempo real. O antigo acordo de cavalheiros está se desmoronando, e a batalha entre os guardiões e os inovadores acaba de começar. O resultado determinará não apenas o futuro da IA, mas o futuro da web aberta em si.

Fonte

Compartilhe esse conteúdo: