A xAI, de propriedade de Elon Musk, adicionou capacidades de compreensão de imagem ao seu modelo de IA Grok. Com isso, os usuários pagos na plataforma social X podem enviar uma imagem e fazer perguntas ao chatbot de IA.
Um dos funcionários da xAI e a conta oficial do Grok postaram sobre essa atualização no X.
Em uma postagem separada, Musk disse que o Grok pode até explicar o significado de uma piada através do novo recurso de compreensão de imagem. Ele acrescentou que a funcionalidade está em estágios iniciais e melhorará ao longo do tempo.
Em agosto, a empresa de IA de Musk lançou o Grok-2 como um modelo e na forma de um chatbot para usuários premium no X. O chatbot na rede social também ganhou capacidades de geração de imagem usando o modelo FLUX.1 do Black Forest Labs.
Naquela época, a xAI disse que lançaria a compreensão multimodal como parte da experiência do Grok no X e na API para desenvolvedores.
O Grok também pode entender documentos em breve. Em resposta ao feedback de um usuário sobre o Grok não ser capaz de lidar com fotos ou PDFs, Musk disse: “Não por muito tempo. Estamos fazendo em meses o que levou a todos os outros anos.”
A rede social tem tentado adicionar mais recursos ao chatbot de IA e aos níveis de usuários pagos para tornar a oferta mais atraente. No início deste mês, o X lançou uma nova ferramenta chamada Radar para assinantes Premium+ para observar tendências em tempo real e fornecer insights sobre conversas.