Início Tecnologia Claude Opus 4.8: Anthropic torna uma IA mais honesta

Claude Opus 4.8: Anthropic torna uma IA mais honesta

27
0

A Anthropic ainda não está pronta para permitir que usuários regulares vejam seu modelo de IA supostamente superpoderoso Claude Mythos. Mas a empresa de IA acaba de lançar uma atualização para seu principal produto, Claude Opus – agora em sua versão 4.8.

“Ele se baseia no Opus 4.7 com melhorias em todos os benchmarks e é um colaborador mais eficaz”, Anthropic prometido em um comunicado de imprensa Quinta-feira. Na verdade, os números de referência abaixo mostram melhorias muito pequenas em todos os aspectos.

Uma grande melhoria, alegadamente, está na área das alucinações. Claude Opus 4.8 não mentirá tanto para os usuários. “Os primeiros testadores relatam que o Opus 4.8 tem maior probabilidade de sinalizar incertezas sobre seu trabalho e menos probabilidade de fazer afirmações sem fundamento”, disse a Anthropic, elogiando a “honestidade” do modelo.

Claude Opus 4.8 tem ‘melhor julgamento’

“Claude Opus 4.8 tem um julgamento visivelmente melhor”, disse um engenheiro do Shopify, Tom Pritchard, à Anthropic. A versão codificada do modelo “faz as perguntas certas, detecta seus próprios erros e recua quando um plano não é sólido”.

Dado o número crescente de histórias de terror sobre agentes de IA que excluem bases de dados corporativas inteiras, essa promessa pode ser música para os ouvidos dos programadores de vibrações em todo o mundo.

Para agradar aos usuários avançados, a Anthropic está oferecendo um desconto significativo no “modo rápido”, onde Claude trabalhará 2,5 vezes a velocidade normal. O modo rápido “agora é três vezes mais barato do que nos modelos anteriores”, disse a empresa.

Os usuários do Reddit não acreditaramno entanto. Muitos temiam a perda de acesso a um modelo mais popular, Claude Opus 4.6. “Ninguém confia nos gráficos de benchmark”, escreveu um redditor em resumo, observando que o Opus 4.7 também parecia ter alguns números muito bons quando foi lançado.

Quer possamos ou não confiar nos benchmarks – e para ser claro, o Mashable não verificou esses números de forma independente – aqui está o que a Anthropic está afirmando.


Crédito: Antrópico

Como experimentar Claude Opus 4.8

Claude Opus 4.8 já está disponível no site da Anthropic, Claude.AIbem como por meio da API Claude, além de parceiros da Anthropic como o Microsoft Foundry.

O novo modelo é preço exatamente o mesmo como seus antecessores, ou seja, modelos que remontam a Claude Opus 4.5. Todos eles custarão US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída.

Dado que a Anthropic está prometendo Claude Mythos dentro de algumas semanas, no entanto, você pode querer esperar para ver se esse modelo pode ser ainda mais “honesto” sobre suas alucinações.

Tópicos
Inteligência Artificial Antrópica

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui