Com o consumo global de conteúdo aumentando e a demanda por conteúdo não em inglês superando a de filmes e programas em inglês, a IMAX está aproveitando a IA para escalar a localização em seu conteúdo original.
A indústria de entretenimento e mídia cresceu 5% para US$ 2,8 trilhões em 2023, de acordo com um relatório da PwC. Espera-se que a indústria continue sua expansão, embora a uma modesta taxa de crescimento anual composta de quase 4% para US$ 3,4 trilhões nos próximos cinco anos. O conteúdo em língua não inglesa está crescendo rapidamente, mesmo em mercados de língua inglesa, incluindo os EUA, Reino Unido, Austrália e Canadá. No ano passado, a Netflix relatou um crescimento de 90% em sua audiência de conteúdo não em inglês no Reino Unido nos últimos três anos.
A IMAX levou tudo isso em consideração e agora está explorando a localização usando IA para atrair mais espectadores.
Na segunda-feira, a empresa canadense de produção de cinema, conhecida por seus enormes cinemas e experiências cinematográficas imersivas, anunciou sua parceria com a startup Camb.ai, baseada em Dubai, para usar seus modelos de fala IA para traduzir conteúdo original, incluindo documentários.
A Camb.ai, que já implantou sua dublagem e tradução de fala IA para eventos esportivos ao vivo e ligas, incluindo o Australian Open, Eurovision Sport e Major League Soccer, oferece seu modelo Boli para tradução de fala para texto e Mars para emulação de fala. Os modelos estão disponíveis através da plataforma DubStudio da startup, que suporta 140 idiomas, incluindo vários idiomas de baixo recurso que não têm dados significativos na internet.
“Empresas como OpenAI e Anthropic têm uma visão diferente da sociedade”, disse Akshat Prakash, cofundador e CTO da Camb.ai, em uma entrevista exclusiva. “Eles estão tentando construir modelos que são muito horizontais e podem cobrir uma grande variedade de tarefas… Nós não precisamos fazer isso. Alguns de nossos modelos têm menos de 100 milhões de parâmetros e são super especializados.”
Prakash, um ex-engenheiro da Apple que trabalhou com a equipe que desenvolveu modelos de IA e ML para a Siri, co-fundou a Camb.ai com seu pai Avneesh Prakash no ano passado.
“Estamos a uma geração de distância e crescemos na Índia. Trinta anos de diferença, encontramos os mesmos desafios linguísticos”, disse o CTO ao TechCrunch.
Ele disse que a Camb.ai pré-treinou 70% de seus modelos usando conjuntos de dados licenciados academicamente, que são comercialmente utilizáveis. Os 30% restantes envolvem o ajuste fino dos dados que recebe através de parceiros iniciais que implantam seus modelos para dublagem e tradução baseadas em IA.
“O que não fazemos, e temos sido muito cuidadosos e completamente evitando isso, é potencialmente raspar a internet”, afirmou Prakash. “Algumas empresas acham que podem escapar disso porque estão construindo um aplicativo ou ferramenta voltada para o consumidor, e acreditam que é aceitável raspar, como 10 petabytes da internet.”
A Camb.ai usa uma abordagem de “três camadas” para fornecer tradução baseada em IA, compreendendo a camada de fundação de seus modelos Boli e Mars, a camada de infraestrutura que hospeda esses modelos de IA e, em seguida, a plataforma DubStudio para a interface.
Ao contrário de outros modelos baseados em IA, o Boli da Camb.ai pega tokens de fala de entrada, produz tokens de texto de saída no idioma traduzido e retém nuances, afirma Prakash. Uma vez que o Boli gera o texto, o Mars traduz o texto em fala usando o mesmo sinal de áudio de entrada para capturar a performance do áudio real, incluindo sons ambientes, como a trilha sonora de fundo da audiência torcendo no caso de eventos esportivos, disse ele.
Prakash disse ao TechCrunch que a tecnologia da Camb.ai oferece tradução de fala em até 10 idiomas simultaneamente com 20 a 30 segundos de latência, que pode ser coberta pelo atraso de streaming e transmissão de 30 a 40 segundos.
A IMAX lançará traduções de IA em etapas, começando com idiomas de alto recurso. O lançamento ocorre após testes internos da tecnologia da Camb.ai em seu conteúdo original.
“Embora ainda estejamos apenas nos estágios iniciais da parceria, continuaremos a trabalhar juntos para explorar melhor seu potencial e como isso pode nos levar adiante”, disse Mark Welton, Presidente da IMAX Global Theatres.
Welton indicou que a implementação da IA ajudaria a economizar nos custos de tradução, sem divulgar detalhes específicos.
A Camb.ai atualmente tem uma equipe de 50 pessoas. Em fevereiro, arrecadou US$ 4 milhões em uma rodada de seed liderada pela Courtside Ventures. Prakash disse ao TechCrunch que a startup está fechando uma rodada maior, pré-Série A, para expandir seu alcance e equipe.