Antrópico modelo de IA generativa mais capaz ainda está nas mãos de algumas organizações e profissionais de segurança cibernética selecionados, mas o modelo Claude mais poderoso que você pode usar agora está sendo atualizado.
Claude Opus 4.8, lançado quinta-feira, é uma “melhoria modesta, mas tangível” em relação ao Opus 4.7, Antrópico disse em uma postagem no blog.
Mas a empresa também disse que está fazendo progressos significativos na produção de uma versão do seu modelo Claude Mythos Preview que está disposta a lançar ao público. Neste momento, restringiu o acesso ao Mythos a um consórcio de parceiros como parte do que chama Projeto Glasswingexplicando que os recursos de segurança cibernética do modelo são avançados o suficiente para garantir que os especialistas em segurança cibernética e as principais empresas de tecnologia tenham algum tempo para corrigir as falhas encontradas pelo modelo.
“Modelos deste nível de capacidade exigem salvaguardas cibernéticas mais fortes antes que possam ser liberados de forma geral”, disse a Anthropic. “Estamos fazendo progressos rápidos no desenvolvimento dessas proteções e esperamos poder levar modelos da classe Mythos a todos os nossos clientes nas próximas semanas”.
Mitos para todos?
A decisão da Anthropic de reter o Mythos Preview do público em geral, pelo menos por enquanto, foi interessante. Foi uma medida sábia e com visão de futuro proteger a infra-estrutura crítica da Internet contra potenciais falhas? Foi uma maneira fácil de aumentar o entusiasmo do marketing? Pesquisadores de segurança descobriram que o modelo é certamente capaz de encontrar explorações muito mais rapidamente do que os hackers humanos, mesmo que não esteja necessariamente indo além das capacidades humanas. Versão mais recente do Firefox da Mozilla incluída mais de 200 correções identificadas pelo Mythos Preview.
Leia mais: Corrida armamentista de IA acelera com novos modelos da OpenAI, DeepSeek e Anthropic
Mas o fato de que o Mythos estará em breve disponível para qualquer pessoa, mesmo com barreiras de segurança cibernéticas significativas, significa que finalmente veremos se o modelo está à altura do hype, com todos os riscos que isso pode acarretar.
Darren Williams, fundador e CEO da empresa de segurança cibernética Névoa Negradisse à CNET por e-mail que o lançamento de grandes modelos costuma ser momentos tensos.
“Por um lado, a decisão da Anthropic de realizar a libertação, adiando até que as salvaguardas sejam desenvolvidas, mostra os instintos certos”, disse ele. “Mas quanto mais capaz for um modelo, maiores serão os riscos se essas salvaguardas forem insuficientes ou se o modelo for eventualmente utilizado indevidamente. A janela entre o lançamento de um modelo poderoso e a ampla adoção de defesas contra ele é sempre um momento vulnerável.”
No entanto, o Mythos será muito mais caro de operar do que outros modelos de IA, e isso pode limitar sua utilidade para hackers. Jake Williamspesquisador de segurança cibernética e membro do corpo docente da IANS Research, disse que o Mythos era 30 vezes mais caro em testes do que o modelo anterior da Opus.
“Isso está fora do alcance de muitos, incluindo quaisquer atores de ameaças a commodities”, disse Williams à CNET por e-mail. “Os intervenientes do Estado-nação já tinham tecnologia melhor para encontrar vulnerabilidades. Isto só está a mudar o jogo para uma pequena percentagem de intervenientes em ameaças.”
O que há de novo sobre Claude Opus 4.8
Quanto ao Opus 4.8, a Anthropic disse que é uma melhoria nos benchmarks em comparação com o Opus 4.7. Os testes descobriram que o Opus 4.8 tinha menos probabilidade de fazer afirmações sem fundamento e mais probabilidade de indicar incerteza, disse a empresa.
Alguns novos recursos também estão chegando aos produtos de IA da Anthropic, incluindo a capacidade de controlar quanto “esforço” um modelo usará para responder a um prompt no Claude.ai e em Claude Cowork. Um esforço maior provavelmente obterá melhores resultados, pois o modelo gasta mais tempo em uma resposta, mas ultrapassará seus limites de uso mais rapidamente. Uma configuração mais baixa responderá mais rapidamente e atingirá os limites de taxa mais lentamente.












