Anthropic lança Claude Sonnet 4.5, seu melhor modelo de IA para programação

Na segunda-feira, a Anthropic lançou um novo modelo de fronteira chamado Claude Sonnet 4.5, que afirma ser de última geração em benchmarks de programação. A empresa diz que o Claude Sonnet 4.5 é capaz de construir aplicações “prontas para produção”, um salto em confiabilidade em relação a modelos de IA anteriores.

O Claude Sonnet 4.5 estará disponível através da API Claude e no chatbot Claude.ai. Os preços para desenvolvedores são os mesmos do Claude Sonnet 4: $3 por milhão de tokens de entrada (aproximadamente 750.000 palavras, ou mais do que toda a série O Senhor dos Anéis) e $15 por milhão de tokens de saída.

No último ano, os modelos de IA da Anthropic se tornaram favoritos entre desenvolvedores e empresas, em grande parte devido ao seu forte desempenho em tarefas de engenharia de software. A Apple e a Meta supostamente usam modelos de Claude AI internamente, e a Anthropic fez um negócio significativo vendendo acesso à API para aplicações de codificação em IA, como Cursor, Windsurf e Replit. Recentemente, o GPT-5 da OpenAI desafiou a dominância da Anthropic neste espaço, superando os modelos Claude em uma variedade de benchmarks de programação.

A Anthropic afirma que o Claude Sonnet 4.5 oferece desempenho líder da indústria em vários benchmarks de programação, incluindo o SWE-Bench Verified. No entanto, o pesquisador de IA da Anthropic, David Hershey, disse ao TechCrunch que é difícil capturar o desempenho do Claude Sonnet 4.5 apenas com benchmarks.

Hershey diz que viu o Claude Sonnet 4.5 codificando autonomamente por até 30 horas durante testes iniciais com alguns clientes empresariais. Durante esse tempo, ele observou o modelo de IA não apenas construindo uma aplicação, mas também configurando serviços de banco de dados, comprando nomes de domínio e realizando uma auditoria SOC 2 para garantir que o produto era seguro.

Em uma declaração compartilhada com o TechCrunch, o CEO da Cursor, Micheal Truell, disse que o Claude Sonnet 4.5 representa um desempenho de codificação de última geração, especificamente em tarefas de longo prazo. O CEO da Windsurf, Jeff Wang, afirmou em uma declaração que o Claude Sonnet 4.5 representa uma “nova geração de modelos de codificação.”

A Anthropic também afirma que o Claude Sonnet 4.5 é seu modelo de IA de fronteira mais alinhado até agora, com taxas mais baixas de adulação e engano do que modelos anteriores. A empresa diz que também melhorou a suscetibilidade de Claude a ataques de injeção de prompts.

Juntamente com o lançamento do Claude Sonnet 4.5, a Anthropic também está lançando o SDK do Claude Agent. A empresa diz que esta é a mesma infraestrutura que alimenta o Claude Code e pode ser usada para ajudar desenvolvedores a construir seus próprios agentes.

A Anthropic também está lançando uma prévia de pesquisa temporária chamada “Imagine with Claude” para assinantes do Max, que mostra o modelo de IA gerando software em tempo real. A empresa diz que o modelo responderá a solicitações dos usuários em tempo real, sem funcionalidade predeterminada ou código pré-escrito.

Fonte

Compartilhe esse conteúdo: