Mistral lança modelo regional focado na língua e cultura árabe

A próxima fronteira para grandes modelos de linguagem (LLMs), uma das tecnologias-chave que sustentam o boom nas ferramentas de IA generativa, pode ser geográfica. Na segunda-feira, a startup de IA com sede em Paris, Mistral — que está competindo com empresas como Anthropic e OpenAI — está lançando um modelo que é um pouco diferente de seu LLM habitual.

Nomeado Mistral Saba, o novo modelo treinado sob medida foi projetado para atender a uma geografia específica: países de língua árabe. O objetivo do Mistral Saba é se destacar em interações em árabe.

Mistral Saba é um modelo relativamente pequeno com 24 bilhões de parâmetros. Como lembrete, menos parâmetros geralmente levam a um melhor desempenho com menor latência. Mas mais parâmetros geralmente significam respostas mais inteligentes, embora não haja uma correlação linear.

Mistral Saba é comparável em tamanho ao Mistral Small 3, seu modelo pequeno de propósito geral. Mas, de acordo com os próprios testes da Mistral, o Mistral Saba apresenta um desempenho muito melhor do que o Mistral Small 3 ao lidar com conteúdo em árabe.

Como um efeito colateral interessante, devido à troca cultural entre o Oriente Médio e o Sul da Ásia, Saba também funciona bem com línguas de origem indiana, segundo a Mistral — especialmente línguas do Sul da Índia, como Tamil e Malayalam.

O novo modelo representa um movimento estratégico interessante para o gigante da IA francês, mostrando um foco crescente no Oriente Médio. A Mistral disse que espera que o modelo a ajude a ganhar tração entre os clientes da região.

Como um modelo pronto para uso, o Mistral Saba pode ser utilizado para suporte conversacional ou geração de conteúdo em árabe que soe mais natural e relevante. Também pode ser usado como base para alguns modelos ajustados para casos de uso internos, disse a empresa.

Na semana passada, a Mistral usou a Cúpula de Ação de IA para demonstrar que está levando a sério os negócios. Embora a empresa já tenha levantado grandes quantias de dinheiro de investidores internacionais, muitos de seus apoiadores estrangeiros estão baseados nos EUA — investidores como Lightspeed Venture Partners, Andreessen Horowitz e Salesforce Ventures.

Devido ao cenário geopolítico em mudança, a Mistral pode potencialmente receber investidores do Oriente Médio em sua próxima rodada de financiamento. Isso seria uma maneira de levantar mais dinheiro para permanecer relevante na corrida da IA em um nível técnico, enquanto se posiciona como a alternativa internacional às empresas de IA dos EUA e da China. O mais novo modelo da Mistral, Saba, poderia, portanto, contribuir para esse esforço de captação de recursos.

O Mistral Saba está acessível através da API da Mistral. Também pode ser implantado localmente, o que pode ser um forte ponto de venda para empresas que atuam em setores sensíveis, como energia, finanças ou saúde.

Devido às raízes europeias da empresa, desde o lançamento do modelo Mistral 7B de pesos abertos, ela tem reiterado que leva o suporte multilíngue a sério. O lançamento do Saba é uma continuação dessa posição. E a Mistral disse que voltará sua atenção para outras línguas regionais no futuro.

Fonte

Compartilhe esse conteúdo: