Mistral lança nova API de reconhecimento óptico de caracteres (OCR) reivindicando desempenho superior globalmente

Em um mar de modelos de raciocínio concorrentes, a empresa apresentou hoje o Mistral OCR, uma nova API de Reconhecimento Óptico de Caracteres (OCR) projetada para fornecer capacidades avançadas de compreensão de documentos.

A API extrai conteúdo – incluindo notas manuscritas, texto digitado, imagens, tabelas e equações – de PDFs e imagens não estruturados com alta precisão, apresentando em um formato estruturado.

Dados estruturados são informações que estão organizadas de maneira predefinida, tipicamente usando linhas e colunas, tornando fácil a pesquisa e análise. Exemplos comuns incluem nomes, endereços e transações financeiras armazenadas em bancos de dados ou planilhas.

Em contraste, dados não estruturados carecem de um formato ou estrutura específica, tornando mais desafiador o processamento e análise. Esta categoria abrange uma ampla gama de tipos de dados, como e-mails, postagens em mídias sociais, vídeos, imagens e arquivos de áudio. Como os dados não estruturados não se encaixam perfeitamente em bancos de dados tradicionais, ferramentas e técnicas especializadas, como processamento de linguagem natural e aprendizado de máquina, são frequentemente usadas para extrair insights significativos deles.

Com suporte multilíngue, velocidades de processamento rápidas e integração com grandes modelos de linguagem para compreensão de documentos, o Mistral OCR está posicionado para ajudar organizações a tornarem sua documentação pronta para IA.

Dado que, de acordo com o post no blog da Mistral anunciando a nova API, 90% de todas as informações comerciais são não estruturadas, a nova API deve ser uma grande vantagem para organizações que buscam digitalizar e catalogar seus dados para uso em aplicações de IA ou bases de conhecimento internas/externas.

O Mistral OCR visa melhorar como as organizações processam e analisam documentos complexos.

Ao contrário das soluções OCR tradicionais que se concentram principalmente na extração de texto, o Mistral OCR é projetado para interpretar vários elementos tipográficos e caracteres de documentos, incluindo tabelas, expressões matemáticas e imagens intercaladas, mantendo saídas estruturadas.

O modelo alcançou as maiores pontuações de precisão no reconhecimento matemático, documentos digitalizados e processamento de texto multilíngue.

O Mistral OCR também é projetado para operar mais rápido que modelos concorrentes, capaz de processar até 2.000 páginas por minuto em um único nó.

Essa vantagem de velocidade o torna adequado para processamento de documentos de alto volume em indústrias como pesquisa, atendimento ao cliente e preservação histórica.

O Mistral OCR apresenta oportunidades significativas para eficiência, segurança e escalabilidade em fluxos de trabalho impulsionados por documentos.

Ao automatizar o processamento de documentos e reduzir a entrada manual de dados, o Mistral OCR reduz a sobrecarga administrativa e agiliza as operações. As organizações podem processar grandes volumes de documentos mais rapidamente e com maior precisão, reduzindo a necessidade de intervenção humana. Isso é particularmente valioso para indústrias como finanças, saúde, jurídica e compliance, onde extensa papelada é um gargalo.

O Mistral OCR está disponível agora na la Plateforme, com planos de expansão para parceiros de nuvem e inferência em um futuro próximo.

Fonte

Compartilhe esse conteúdo: