Apenas três dias depois do lançamento de Fábula 5uma versão nerfada do temido Mythos, a Anthropic foi forçada a colocá-lo offline.
Em um postagem no blog publicado na sexta-feira, a empresa disse que recebeu ordens de funcionários da administração Trump para interromper o acesso ao Fable – e a outro modelo menos amplamente disponível, chamado Mythos 5 – para todos os estrangeiros dentro e fora dos Estados Unidos, incluindo os próprios funcionários da empresa. Para cumprir, a Anthropic disse que teve que desativar o acesso aos modelos para todos os usuários.
As autoridades federais emitiram a ordem em resposta a informações que indicavam que os modelos da empresa poderiam ser levados a contornar certas barreiras de segurança, de acordo com o post, representando assim o que a administração considerou ser um risco para a segurança nacional. No entanto, a empresa acrescentou que as supostas vulnerabilidades “parecem relativamente simples e descobrimos que outros modelos disponíveis publicamente também são capazes de descobri-las sem a necessidade de um desvio”. A postagem também reiterou o fato de que o Fable foi implantado com grades de segurança tão robustas e sensíveis que se tornaram um fonte de agravamento para alguns usuários.
Mais tarde relatórios de A Informação revelou que a decisão da administração Trump foi motivada, pelo menos em parte, por conversas anteriores entre o CEO da Amazon, Andy Jassy, e funcionários do governo, incluindo o secretário do Tesouro, Scott Bessent. Jassy teria dito aos funcionários que pesquisadores internos da Amazon conseguiram levar a Fable a gerar informações confidenciais que poderiam ser usadas por hackers para contornar os sistemas de segurança cibernética da empresa, o que levou a uma reunião entre os funcionários. A diretriz da Antrópica para restringir o acesso de estrangeiros aos modelos foi assinada pelo presidente Trump.
Apontando dedos
Em um X postagem no sábado, o consultor de ciência e tecnologia da Casa Branca, David Sacks, disse que o governo emitiu sua ordem à Anthropic “com relutância” e somente depois que o CEO da empresa, Dario Amodei, “se recusou” a resolver o problema de segurança.
“A esperança do administrador agora é que o Anthropic remedie o problema de segurança, o controle de exportação seja suspenso e o Fable volte ao lançamento geral”, escreveu Sacks no post. “O administrador quer que tudo isso aconteça o mais rápido possível. É francamente perplexo que a Anthropic não tenha querido cumprir as solicitações de segurança que anteriormente dizia serem sua maior prioridade.”
A Antrópica também parecia relutante em ter que desativar os modelos. “Estamos cumprindo as diretrizes legais do governo e removendo o acesso ao Fable 5 e Mythos 5 para todos os usuários”, escreveu a empresa em seu blog. “No entanto, discordamos que a descoberta de um potencial jailbreak restrito deva ser motivo para revogar um modelo comercial implantado para centenas de milhões de pessoas.”
A postagem passou a sugerir que a empresa estava sendo alvo injustamente da administração Trump: “Se esse padrão fosse aplicado em toda a indústria”, escreveu a Anthropic, “acreditamos que isso interromperia essencialmente todas as implantações de novos modelos para todos os fornecedores de modelos de fronteira”.
À luz dos recentes confrontos entre a Anthropic e o governo federal, não é uma suspeita tão irracional. Após uma disputa com o Departamento de Guerra sobre o uso de seus sistemas de IA nas forças armadas, a empresa foi oficialmente designada como risco à segurança nacional pelo Pentágono. (Desde então, a Anthropic entrou com duas ações judiciais contestando a designação.) Em seu post X, Sacks negou que a ordem de restrição contra os modelos mais recentes da Anthropic tivesse algo a ver com a disputa da empresa com o Departamento de Guerra.
“Isso não é um desvio do guardrail”
Embora a linha oficial da administração Trump tenha sido a de que a sua mão foi forçada a emitir a ordem à Anthropic, e que o fez puramente no interesse de preservar a segurança nacional, alguns apontaram que a medida poderia ter o efeito oposto.
Um carta aberta publicado no domingo e assinado por dezenas de especialistas da indústria de segurança cibernética e de tecnologia argumentou que, ao restringir o acesso aos novos modelos da Antrópico, o governo involuntariamente deu vantagem aos desenvolvedores de tecnologia chineses. Sistemas poderosos de IA são usados rotineiramente por especialistas em segurança cibernética para testar a pressão dos sistemas de segurança cibernética existentes, destacou a carta, o que significa que a experimentação com Fable 5 e Mythos 5 é crucial para construir e atualizar defesas cibernéticas.
“Os modelos abertos chineses estão apenas alguns meses atrás dos melhores modelos americanos, e esses são os modelos que conhecemos”, argumentava a carta. “Parece provável que o governo da RPC tenha acesso a capacidades privadas para além do que foi publicado. É perigoso retirar as melhores capacidades dos defensores sem uma boa razão quando os nossos adversários estão a avançar rapidamente.”
Por conta própria postagem no blog publicado na segunda-feira, a empresária e estrategista de longa data de segurança cibernética da Microsoft, Katie Moussouris, disse que as supostas vulnerabilidades expostas pela Amazon eram na verdade um recurso, não um bug. De acordo com Moussouris, os pesquisadores da Amazon inicialmente alimentaram o código-fonte aberto do Fable e pediram ao modelo que encontrasse as vulnerabilidades de segurança cibernética, mas ele recusou. Eles então solicitaram “consertar este código” e, em seguida, transformaram os resultados resultantes em ataques cibernéticos automatizados para executar o modelo, o que Moussouris disse ser uma prática padrão em segurança cibernética.
“Os defensores precisam ser capazes de pedir à IA para corrigir os bugs em um arquivo, explicar por que a correção é importante e escrever testes que confirmem que o patch funciona”, escreveu Moussouris. “Isso não é um desvio do guardrail. É a coisa mais valiosa que um modelo de IA pode fazer para a segurança defensiva: executar o loop de localização, correção e teste que os defensores executam todos os dias.”













