Dois anos após o lançamento público do ChatGPT, as conversas sobre IA são inescapáveis, à medida que empresas de todos os setores buscam aproveitar modelos de linguagem grandes (LLMs) para transformar seus processos de negócios. No entanto, por mais poderosos e promissores que os LLMs sejam, muitos líderes de negócios e de TI passaram a depender excessivamente deles e a ignorar suas limitações. É por isso que antecipo um futuro onde modelos de linguagem especializados, ou SLMs, desempenharão um papel complementar maior na TI empresarial.
Os SLMs são mais tipicamente chamados de “modelos de linguagem pequenos” porque requerem menos dados e tempo de treinamento e são “versões mais simplificadas dos LLMs”. Mas eu prefiro a palavra “especializado” porque transmite melhor a capacidade dessas soluções construídas para desempenhar trabalhos altamente especializados com maior precisão, consistência e transparência do que os LLMs. Ao suplementar os LLMs com SLMs, as organizações podem criar soluções que aproveitam as forças de cada modelo.
Confiança e o problema da ‘caixa-preta’ dos LLMs
Os LLMs são incrivelmente poderosos, mas também são conhecidos por, às vezes, “perderem o fio da meada”, ou oferecerem resultados que se desviam do curso devido ao seu treinamento generalista e conjuntos de dados massivos. Essa tendência se torna mais problemática pelo fato de que o ChatGPT da OpenAI e outros LLMs são essencialmente “caixas-pretas” que não revelam como chegam a uma resposta.
Esse problema da caixa-preta se tornará uma questão maior no futuro, particularmente para empresas e aplicações críticas para os negócios onde precisão, consistência e conformidade são fundamentais. Pense em setores como saúde, serviços financeiros e jurídico, como exemplos principais de profissões onde respostas imprecisas podem ter enormes consequências financeiras e até mesmo repercussões de vida ou morte. Os órgãos reguladores já estão notando isso e provavelmente começarão a exigir soluções de IA explicáveis, especialmente em indústrias que dependem de privacidade de dados e precisão.
Embora as empresas frequentemente adotem uma abordagem “humano no loop” para mitigar esses problemas, uma dependência excessiva dos LLMs pode levar a uma falsa sensação de segurança. Com o tempo, a complacência pode se instalar e erros podem passar despercebidos.
SLMs = maior explicabilidade
Felizmente, os SLMs estão mais bem equipados para abordar muitas das limitações dos LLMs. Em vez de serem projetados para tarefas de propósito geral, os SLMs são desenvolvidos com um foco mais estreito e treinados em dados específicos de domínio. Essa especificidade permite que eles lidem com requisitos de linguagem sutis em áreas onde a precisão é fundamental. Em vez de depender de vastos conjuntos de dados heterogêneos, os SLMs são treinados em informações direcionadas, proporcionando-lhes a inteligência contextual para oferecer respostas mais consistentes, previsíveis e relevantes.
Isso oferece várias vantagens. Primeiro, eles são mais explicáveis, facilitando a compreensão da fonte e da razão por trás de suas saídas. Isso é crítico em indústrias regulamentadas onde as decisões precisam ser rastreadas até uma fonte.
Em segundo lugar, seu tamanho menor significa que eles podem muitas vezes operar mais rapidamente do que os LLMs, o que pode ser um fator crucial para aplicações em tempo real. Terceiro, os SLMs oferecem às empresas mais controle sobre a privacidade e a segurança dos dados, especialmente se forem implantados internamente ou construídos especificamente para a empresa.
Além disso, embora os SLMs possam inicialmente exigir treinamento especializado, eles reduzem os riscos associados ao uso de LLMs de terceiros controlados por provedores externos. Esse controle é inestimável em aplicações que exigem manuseio de dados rigoroso e conformidade.
Concentre-se em desenvolver expertise (e tenha cuidado com fornecedores que prometem demais)
Quero deixar claro que LLMs e SLMs não são mutuamente exclusivos. Na prática, os SLMs podem aumentar os LLMs, criando soluções híbridas onde os LLMs fornecem um contexto mais amplo e os SLMs garantem uma execução precisa. Também ainda é cedo, mesmo no que diz respeito aos LLMs, então sempre aconselho os líderes de tecnologia a continuarem explorando as muitas possibilidades e benefícios dos LLMs.
Além disso, embora os LLMs possam escalar bem para uma variedade de problemas, os SLMs podem não se transferir bem para certos casos de uso. Portanto, é importante ter uma compreensão clara desde o início sobre quais casos de uso abordar.
É também importante que os líderes de negócios e de TI dediquem mais tempo e atenção para construir as habilidades distintas necessárias para treinar, ajustar e testar os SLMs. Felizmente, há uma grande quantidade de informações e treinamentos gratuitos disponíveis por meio de fontes comuns como Coursera, YouTube e Huggingface.co. Os líderes devem garantir que seus desenvolvedores tenham tempo adequado para aprender e experimentar com SLMs, à medida que a batalha pela expertise em IA se intensifica.
Também aconselho os líderes a avaliar cuidadosamente os parceiros. Recentemente, conversei com uma empresa que pediu minha opinião sobre as alegações de um determinado fornecedor de tecnologia. Minha opinião foi que eles estavam exagerando ou simplesmente estavam fora de seu alcance em termos de compreensão das capacidades da tecnologia.
A empresa sabiamente deu um passo para trás e implementou um conceito de prova controlada para testar as alegações do fornecedor. Como eu suspeitei, a solução simplesmente não estava pronta para o mercado, e a empresa conseguiu se afastar com relativamente pouco tempo e dinheiro investidos.
Seja uma empresa começando com um conceito de prova ou uma implementação ao vivo, aconselho que comecem pequeno, testem frequentemente e construam sobre os sucessos iniciais. Eu pessoalmente experimentei trabalhar com um pequeno conjunto de instruções e informações, apenas para descobrir que os resultados se desviavam quando eu alimentava o modelo com mais informações. É por isso que uma abordagem cuidadosa e gradual é prudente.
Em resumo, enquanto os LLMs continuarão a fornecer capacidades cada vez mais valiosas, suas limitações estão se tornando cada vez mais evidentes à medida que as empresas ampliam sua dependência da IA. Suplementar com SLMs oferece um caminho a seguir, especialmente em campos de alto risco que exigem precisão e explicabilidade. Ao investir em SLMs, as empresas podem preparar suas estratégias de IA para o futuro, garantindo que suas ferramentas não apenas impulsionem a inovação, mas também atendam às demandas de confiança, confiabilidade e controle.