Lançamento do Claude Fable 5 e Mythos 5 com capacidades avançadas de IA

Hoje, estamos lançando o Claude Fable 5, um modelo da classe Mythos que foi adaptado para uso geral.

As capacidades do Fable 5 superam as de qualquer modelo que já disponibilizamos. Este modelo é considerado o estado da arte em quase todos os benchmarks de capacidade de IA testados, apresentando um desempenho excepcional em engenharia de software, pesquisa científica, trabalho de conhecimento e muito mais. Quanto mais longa e complexa a tarefa, maior é a vantagem do Fable 5 em relação aos nossos outros modelos.

Entretanto, a liberação de um modelo tão poderoso apresenta riscos. Sem as devidas salvaguardas, as capacidades do Fable 5 em áreas como cibersegurança poderiam ser mal utilizadas. Por isso, lançamos o modelo com medidas de segurança que redirecionam consultas em determinados tópicos para nosso modelo mais capaz, o Claude Opus 4.8. Já que nosso objetivo é um lançamento rápido e seguro, ajustamos essas salvaguardas de forma conservadora. Elas podem ocasionalmente bloquear pedidos inofensivos, mas, em média, acionam em menos de 5% das sessões.

Além do Fable 5, estamos introduzindo também o Claude Mythos 5, que mantém a mesma base do Fable 5, mas com algumas salvaguardas removidas. O Mythos 5 será inicialmente disponibilizado através do Projeto Glasswing, em colaboração com o governo dos EUA, como uma versão aprimorada do Claude Mythos Preview. Este modelo possui as melhores capacidades de cibersegurança do mundo.

As capacidades dos modelos como Fable 5 e Mythos 5 têm o potencial de trazer benefícios significativos. No Projeto Glasswing, por exemplo, esses modelos ajudaram defensores cibernéticos a proteger softwares críticos. Além disso, em pesquisas nas ciências da vida, os modelos têm contribuído com hipóteses novas e acelerado o desenvolvimento de terapias.

Ambos os modelos estão disponíveis por $10 por milhão de tokens de entrada e $50 por milhão de tokens de saída, um custo inferior à metade do preço do Claude Mythos Preview. O lançamento conjunto de hoje é um passo importante para trazer capacidades avançadas de IA a um maior número de usuários, de forma rápida e segura.

Fable 5 e Mythos 5 podem operar de forma autônoma por períodos mais longos do que qualquer um dos modelos anteriores. No que diz respeito à engenharia de software, durante os testes iniciais, a Stripe relatou que o Fable 5 conseguiu reduzir meses de trabalho em dias. Em um código de 50 milhões de linhas, o modelo realizou uma migração em um único dia que, caso feito manualmente, levaria uma equipe inteira mais de dois meses.

No que se refere a trabalho de conhecimento, o Fable 5 apresentou um desempenho excepcional em tarefas analíticas complexas. Na avaliação de finanças da Hebbia, o Fable 5 obteve a maior pontuação de todos os modelos, demonstrando ganhos significativos em raciocínio baseado em documentos e interpretação de gráficos.

O Fable 5 é também o novo padrão para tarefas que envolvem visão, sendo capaz de extrair números precisos de figuras científicas detalhadas e realizar tarefas complexas baseadas em visão. Com acesso à memória persistente, o modelo demonstrou um desempenho três vezes melhor em jogos de construção de baralhos, alcançando a etapa final com mais frequência.

Com o Mythos 5, nossos especialistas internos em design de proteínas aceleraram significativamente o processo de design de medicamentos. Em um exemplo, o modelo conseguiu igualar ou superar operadores humanos habilidosos em várias tarefas do processo.

No que diz respeito à biologia molecular, o Mythos 5 é o primeiro modelo a produzir consistentemente hipóteses científicas novas e convincentes. Em comparações cegas, os cientistas preferiram as hipóteses do Mythos cerca de 80% das vezes.

A segurança é uma prioridade. Nossos classificadores foram projetados para detectar tentativas de uso indevido e impedir que o Fable 5 responda a consultas relacionadas à cibersegurança e biologia. Mais de 95% das sessões do Fable não exigiram redirecionamento para o Opus 4.8, o que demonstra sua eficácia em manter a integridade das operações.

Os clientes que tiveram acesso antecipado ao Fable 5 relataram resultados impressionantes, apontando que o modelo superou as expectativas em diversas áreas, como desenvolvimento de software e análise financeira. O feedback inicial é promissor e destaca a diferença significativa que o Fable 5 traz em relação aos modelos anteriores, indicando um futuro onde desenvolvedores poderão confiar mais nas operações autônomas de IA.

A partir de hoje, o Claude Fable 5 está disponível em todo lugar, enquanto o Claude Mythos 5 terá acesso restrito inicialmente aos parceiros do Projeto Glasswing e, em breve, a pesquisadores da área de biologia.