A tecnologia de marca d’água para texto SynthID do Google, uma ferramenta criada pela empresa para facilitar a identificação de texto gerado por IA, agora está disponível como código aberto através do Google Responsible Generative AI Toolkit, anunciou a empresa no X.
“Agora, outros desenvolvedores de IA generativa poderão usar essa tecnologia para ajudá-los a detectar se as saídas de texto vieram de seus próprios modelos de linguagem de grande porte, facilitando para mais desenvolvedores construir IA de forma responsável”, disse Pushmeet Kohli, vice-presidente de pesquisa do Google DeepMind, ao MIT Technology Review.
As marcas d’água se tornaram ferramentas cada vez mais importantes, uma vez que modelos de linguagem de grande porte são usados para espalhar desinformação política, gerar conteúdo sexual não consensual e para outros fins maliciosos. A Califórnia já está analisando a possibilidade de tornar a marcação de IA obrigatória, enquanto o governo da China começou a exigir isso no ano passado. No entanto, as ferramentas ainda estão em desenvolvimento.
O SynthID, que foi anunciado em agosto passado, ajuda a tornar a saída gerada por IA detectável ao adicionar uma marca d’água invisível em imagens, áudio, vídeo e texto à medida que são gerados. O Google afirma que a versão de texto do SynthID funciona ajustando a probabilidade dos tokens gerados de uma maneira que é detectável por software, mas não por humanos:
Um LLM gera texto um token de cada vez. Esses tokens podem representar um único caractere, palavra ou parte de uma frase. Para criar uma sequência de texto coerente, o modelo prevê o próximo token mais provável a ser gerado. Essas previsões são baseadas nas palavras precedentes e nas pontuações de probabilidade atribuídas a cada token potencial.
Por exemplo, com a frase “Minhas frutas tropicais favoritas são __.” O LLM pode começar a completar a frase com os tokens “manga,” “lichia,” “mamão,” ou “durian,” e cada token recebe uma pontuação de probabilidade. Quando há uma gama de diferentes tokens para escolher, o SynthID pode ajustar a pontuação de probabilidade de cada token previsto, nos casos em que isso não comprometer a qualidade, precisão e criatividade da saída.
Esse processo é repetido ao longo do texto gerado, de modo que uma única frase pode conter dez ou mais pontuações ajustadas, e uma página pode conter centenas. O padrão final de pontuações tanto para as escolhas de palavras do modelo quanto para as pontuações de probabilidade ajustadas é considerado a marca d’água.
O Google afirma que o sistema, que já está integrado em seu chatbot Gemini, não compromete a qualidade, precisão, criatividade ou velocidade do texto gerado, que tem sido um problema há muito tempo com sistemas de marcação d’água. O Google diz que pode funcionar em textos tão curtos quanto três frases, bem como em textos que foram cortados, parafraseados ou modificados. Mas tem dificuldades com textos curtos, conteúdo que foi reescrito ou traduzido, e até mesmo respostas a perguntas factuais.
“O SynthID não é uma solução mágica para identificar conteúdo gerado por IA”, escreveu o Google em um post no blog em maio. “[Mas] é um importante bloco de construção para desenvolver ferramentas de identificação de IA mais confiáveis e pode ajudar milhões de pessoas a tomar decisões informadas sobre como interagem com conteúdo gerado por IA.