Nova Geração dos Modelos Claude: Opus 4 e Sonnet 4

Hoje, apresentamos a próxima geração dos modelos Claude: Claude Opus 4 e Claude Sonnet 4, que estabelecem novos padrões para programação, raciocínio avançado e agentes de IA.

O Claude Opus 4 é considerado o melhor modelo de codificação do mundo, com desempenho consistente em tarefas complexas e processos de trabalho de agentes. Já o Claude Sonnet 4 representa uma atualização significativa em relação ao Claude Sonnet 3.7, oferecendo desempenho superior em programação e raciocínio, além de responder de maneira mais precisa às instruções dos usuários.

Os novos modelos apresentam melhorias notáveis, como a capacidade de usar ferramentas durante o raciocínio prolongado, permitindo que Claude alterne entre o raciocínio e o uso de ferramentas como pesquisa na web, resultando em respostas aprimoradas. Além disso, eles podem executar ferramentas em paralelo, seguir instruções com maior precisão e demonstrar capacidades de memória significativamente melhoradas quando têm acesso a arquivos locais fornecidos pelos desenvolvedores.

Claude Opus 4, em particular, se destaca em tarefas de programação e resolução de problemas complexos, sendo considerado de ponta por várias empresas. A Cursor o classifica como uma inovação na compreensão de bases de código complexas, enquanto a Replit observa um aumento na precisão e melhorias em mudanças complexas em múltiplos arquivos. O modelo também foi validado pela Rakuten em um teste rigoroso que durou 7 horas, mostrando desempenho sustentável.

O Claude Sonnet 4, embora não alcance o nível do Opus 4 em todos os aspectos, ainda se destaca com uma impressionante taxa de 72.7% no SWE-bench. Ele é ideal para casos de uso internos e externos, oferecendo um equilíbrio entre desempenho e eficiência, além de melhor controle sobre as implementações.

A nova versão do Claude Code, que agora está disponível, permite que os desenvolvedores colaborem de maneira mais eficaz com Claude, integrando-se diretamente ao VS Code e JetBrains, e facilitando o trabalho em equipe com revisões de código em tempo real.

Os modelos Claude 4 oferecem um desempenho robusto em tarefas de programação, raciocínio e capacidades multimodais. Também foram implementadas melhorias para reduzir comportamentos indesejáveis, como o uso de atalhos para completar tarefas, tornando-os 65% menos propensos a esse tipo de comportamento em tarefas específicas.

Além disso, introduzimos resumos de raciocínio que utilizam um modelo menor para condensar processos de pensamento longos, embora isso seja necessário apenas em 5% das vezes, já que a maioria dos processos de pensamento é breve o suficiente para ser exibida na íntegra.

Estamos ansiosos para ver o que você criará com esses novos modelos. Comece hoje mesmo com Claude, Claude Code ou na plataforma de sua escolha. Seu feedback é sempre bem-vindo e fundamental para nossas melhorias.