A Nous Research, o coletivo de IA baseado em Nova York conhecido por desenvolver o que chama de modelos de linguagem “personalizados e irrestritos”, lançou uma nova API de Inferência que torna seus modelos mais acessíveis a desenvolvedores e pesquisadores por meio de uma interface programática.
O lançamento da API representa uma expansão significativa das ofertas da Nous Research, que têm chamado atenção por desafiar as abordagens mais restritas de empresas de IA maiores como OpenAI e Anthropic.
“Ouvimos seu feedback e criamos um sistema simples para tornar nossos modelos de linguagem mais acessíveis a desenvolvedores e pesquisadores em todos os lugares”, anunciou a empresa nas redes sociais hoje.
O lançamento inicial da API apresenta dois dos modelos de destaque da empresa: Hermes 3 Llama 70B, um poderoso modelo geral baseado na arquitetura Llama 3.1 da Meta, e DeepHermes-3 8B Preview, o modelo de raciocínio recentemente lançado da empresa que permite aos usuários alternar entre respostas padrão e cadeias de pensamento detalhadas.
Para gerenciar a demanda, a Nous implementou um sistema de lista de espera por meio de seu novo portal em portal.nousresearch.com, com acesso concedido por ordem de chegada. A empresa está fornecendo a todas as novas contas $5,00 em créditos gratuitos. Os desenvolvedores podem acessar a documentação da API para saber mais sobre as opções de integração.
A abordagem da lista de espera oferece uma visão crítica sobre o posicionamento estratégico da Nous Research. Ao contrário de grandes players com reservas enormes de GPU, a Nous enfrenta as limitações de infraestrutura comuns a organizações menores de IA. A lista de espera serve tanto como uma necessidade técnica quanto como uma tática de marketing, criando uma exclusividade que gera buzz enquanto gerencia a carga computacional.
O que torna essa abordagem particularmente notável é como reflete o ethos grassroots da Nous. Enquanto a empresa se posiciona como uma alternativa à IA da Big Tech, também adota estratégias de negócios pragmáticas que reconhecem as realidades de escalonar serviços de inferência. Essa tensão entre idealismo e praticidade provavelmente definirá a jornada da Nous ao transitar de lançamentos puramente de código aberto para ofertas comerciais.
A API segue o padrão de design da API da OpenAI para conclusões e conclusões de chat, tornando potencialmente mais fácil para desenvolvedores já familiarizados com essa interface integrar os modelos da Nous em seus aplicativos.
Este lançamento da API ocorre apenas quatro meses após a Nous Research estrear o Nous Chat em novembro, a primeira interface de chatbot voltada para o usuário da empresa. Embora a empresa tenha lançado numerosos modelos de código aberto para implantação local, a nova API permite que os desenvolvedores acessem versões de alto desempenho desses modelos sem gerenciar sua própria infraestrutura.
DeepHermes-3, lançado apenas no mês passado, representa a entrada da empresa no campo cada vez mais competitivo dos modelos de IA focados em raciocínio. O modelo permite que os usuários alternem entre respostas concisas e processos de raciocínio detalhados por meio de um prompt de sistema que ativa suas capacidades de “pensamento”.
Desde sua fundação em 2023, a Nous Research se posicionou como uma alternativa aos sistemas de IA mais controlados. A empresa enfatiza a agência individual e a alinhamento com as necessidades do usuário, refletido em postagens de blog com títulos como “Liberdade na Fronteira” e “De Caixa Preta a Casa de Vidro: O Imperativo por um Desenvolvimento Transparente de IA”.
Essa postura filosófica ressoou com desenvolvedores em busca de sistemas de IA mais flexíveis, embora a abordagem também tenha levantado questões sobre a implantação responsável. Apesar de se comercializar como “irrestrita”, os modelos da empresa incluem algumas barreiras contra saídas prejudiciais.
O lançamento da API sinaliza o movimento da Nous Research em direção a um modelo de negócios mais sustentável, mantendo seu compromisso com os princípios de código aberto. De acordo com o cronograma de lançamentos da empresa, a Nous lançou 29 artefatos de IA desde julho de 2023, incluindo modelos, artigos, código e conjuntos de dados.
A API representa uma evolução delicada, mas crucial, no modelo de negócios da Nous Research. Ao comercializar a implantação enquanto continua a liberar pesos de modelo, a Nous está tentando resolver um círculo difícil: gerar receita sem alienar a comunidade de código aberto que forma sua base.
Essa abordagem híbrida parece projetada para capturar diferentes segmentos do mercado. Desenvolvedores e pesquisadores individuais ainda podem baixar e executar modelos localmente, enquanto empresas que buscam confiabilidade, conveniência e otimização de desempenho podem pagar pelo acesso à API. Na verdade, a Nous está monetizando a infraestrutura e a camada de otimização em vez dos próprios modelos — uma estratégia que aborda o desafio econômico fundamental da IA de código aberto sem comprometer seus princípios centrais.
O sucesso dessa abordagem pode determinar se laboratórios de IA independentes podem estabelecer modelos de negócios sustentáveis que preservem sua independência em relação às grandes empresas de tecnologia ou firmas de capital de risco que podem pressionar por uma comercialização mais agressiva. Para desenvolvedores preocupados com a centralização da IA, o experimento da Nous representa um caminho potencial que poderia manter a diversidade no ecossistema de IA.
A Nous Research indica que suas ofertas de inferência irão se expandir ao longo do tempo, potencialmente incluindo mais de seus modelos como Hermes 2 Pro, que se especializa em chamadas de funções, ou seu projeto Psyche recentemente anunciado.
Para o crescente ecossistema de startups de IA que constroem sobre modelos abertos, a nova API fornece outra opção além de players estabelecidos como Together AI, Anthropic e OpenAI, potencialmente aumentando a competição e impulsionando mais inovação no espaço de inferência de IA.
“Agradecemos suas ideias para ajudar a moldar o futuro”, concluiu a empresa em seu anúncio.