O governo dos EUA ordenou na sexta-feira que a Anthropic fechasse imediatamente o acesso a dois de seus modelos de IA mais poderosos – Claude Fable 5 e Claude Mythos 5 – citando preocupações de segurança nacional. Antrópico anunciado no X que cumpriu, mas deixou claro que pensa que o governo entendi errado.
A diretriz, que a Anthropic disse ter recebido na sexta-feira às 17h21, horário do leste dos EUA, força a empresa a desativar ambos os modelos para todos os usuários em todo o mundo – não apenas para os estrangeiros aos quais a ordem de controle de exportação do governo se destinava nominalmente. O acesso aos demais modelos da Antrópico não é afetado.
Por que isso importa? Mythos é o modelo de IA mais capaz da Anthropic, que a empresa apresentou no início de abril e tem sido mantido fortemente restrito desde então por causa do que a Anthropic descreveu como sua capacidade excepcional de encontrar vulnerabilidades de segurança em software. De acordo com a Anthropic, a Mythos identificou falhas em todos os principais sistemas operacionais e navegadores testados, então, em vez de divulgá-lo amplamente, a empresa lançou um programa controlado chamado Project Glasswing, compartilhando-o com cerca de 50 organizações avaliadas, incluindo Amazon, Apple, Google, Microsoft e CrowdStrike, para uso em trabalhos defensivos de segurança cibernética.
Fable 5, lançado há apenas três dias, foi a resposta da Anthropic à óbvia pressão comercial: uma versão do Mythos equipada com grades de proteção que bloqueiam respostas em áreas de alto risco como segurança cibernética e biologia, tornando-o seguro o suficiente para lançamento geral, argumentou a empresa. Foi imediatamente o modelo de IA mais capaz disponível ao público, de acordo com testes de benchmark da Vals AI, uma empresa que acompanha o desempenho da tecnologia de IA.
A diretriz do governo é enquadrada como uma ação de controle de exportação, restringindo o acesso de estrangeiros aos modelos. Mas em um longa postagem no blogA Anthropic diz que seu entendimento é que a preocupação subjacente é um suposto jailbreak do Fable 5. Até agora, diz a empresa, o governo forneceu apenas evidências verbais de um “potencial jailbreak restrito e não universal” – um que, como a Antrópico o descreve, equivale a solicitar ao modelo que leia uma base de código específica e identifique falhas de software. E, a propósito, acrescenta a empresa, é um “nível de capacidade” que já está amplamente disponível em outros modelos acessíveis ao público, incluindo o GPT-5.5 da OpenAI. Também é usado rotineiramente por profissionais de segurança cibernética para fins defensivos, diz a Anthropic.
O argumento mais amplo da Antrópico é que as suas salvaguardas mais fortes operam através de sistemas de classificação independentes que funcionam separadamente do próprio modelo, o que significa que mesmo que alguém convença Fable a continuar a falar após uma recusa, as proteções subjacentes contra os resultados mais perigosos permanecem em vigor.
Claramente, nada disso foi suficiente para impedir o governo de agir, e a Anthropic não esconde a sua frustração. “Discordamos que a descoberta de um potencial jailbreak restrito deveria ser motivo para o recall de um modelo comercial implantado para centenas de milhões de pessoas”, escreveu a empresa. “Se este padrão fosse aplicado em toda a indústria, acreditamos que basicamente interromperia todas as implantações de novos modelos para todos os fornecedores de modelos de fronteira.”
Espera-se que a Anthropic faça um IPO este ano e apostou grande parte de sua identidade pública em ser a alternativa consciente em termos de segurança aos seus rivais. A ironia não passa despercebida aos observadores de que a própria cautela que a Antrópica demonstrou ao restringir a Mythos – que promoveu como um modelo tão perigoso que não poderia ser divulgado publicamente – aparentemente atraiu agora exactamente o tipo de escrutínio governamental que mais poderia perturbar os seus negócios.
Sam Altman da OpenAI deve estar gostando disso, pelo menos. Em abril, ele disse ao podcaster Ashlee Vance que a forma como a Anthropic lidou com Mythos equivalia a “marketing baseado no medo”. “É claramente um marketing incrível dizer: ‘Construímos uma bomba. Estávamos prestes a jogá-la na sua cabeça. Vamos lhe vender um abrigo antiaéreo por US$ 100 milhões'”, disse Altman. Altman, cuja empresa também deverá realizar um IPO o mais rápido possível, não previu uma paralisação do governo, mas identificou algo que voltou a afetar a Antthropic por enquanto: quando você passa meses dizendo ao mundo que sua IA é excepcionalmente perigosa, o mundo – incluindo o governo dos EUA – tende a ouvir.
Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.












