Início Tecnologia Os avisos de segurança da Anthropic podem ter saído pela culatra –...

Os avisos de segurança da Anthropic podem ter saído pela culatra – o governo desligou sua IA mais poderosa

38
0

O governo dos EUA ordenou na sexta-feira que a Anthropic fechasse imediatamente o acesso a dois de seus modelos de IA mais poderosos – Claude Fable 5 e Claude Mythos 5 – citando preocupações de segurança nacional. Antrópico anunciado no X que cumpriu, mas deixou claro que pensa que o governo entendi errado.

A diretriz, que a Anthropic disse ter recebido na sexta-feira às 17h21, horário do leste dos EUA, força a empresa a desativar ambos os modelos para todos os usuários em todo o mundo – não apenas para os estrangeiros aos quais a ordem de controle de exportação do governo se destinava nominalmente. O acesso aos demais modelos da Antrópico não é afetado.

Por que isso importa? Mythos é o modelo de IA mais capaz da Anthropic, que a empresa apresentou no início de abril e tem sido mantido fortemente restrito desde então por causa do que a Anthropic descreveu como sua capacidade excepcional de encontrar vulnerabilidades de segurança em software. De acordo com a Anthropic, a Mythos identificou falhas em todos os principais sistemas operacionais e navegadores testados, então, em vez de divulgá-lo amplamente, a empresa lançou um programa controlado chamado Project Glasswing, compartilhando-o com cerca de 50 organizações avaliadas, incluindo Amazon, Apple, Google, Microsoft e CrowdStrike, para uso em trabalhos defensivos de segurança cibernética.

Fable 5, lançado há apenas três dias, foi a resposta da Anthropic à óbvia pressão comercial: uma versão do Mythos equipada com grades de proteção que bloqueiam respostas em áreas de alto risco como segurança cibernética e biologia, tornando-o seguro o suficiente para lançamento geral, argumentou a empresa. Foi imediatamente o modelo de IA mais capaz disponível ao público, de acordo com testes de benchmark da Vals AI, uma empresa que acompanha o desempenho da tecnologia de IA.

Créditos da imagem:Vals AI /

A diretriz do governo é enquadrada como uma ação de controle de exportação, restringindo o acesso de estrangeiros aos modelos. Mas em um longa postagem no blogA Anthropic diz que seu entendimento é que a preocupação subjacente é um suposto jailbreak do Fable 5. Até agora, diz a empresa, o governo forneceu apenas evidências verbais de um “potencial jailbreak restrito e não universal” – um que, como a Antrópico o descreve, equivale a solicitar ao modelo que leia uma base de código específica e identifique falhas de software. E, a propósito, acrescenta a empresa, é um “nível de capacidade” que já está amplamente disponível em outros modelos acessíveis ao público, incluindo o GPT-5.5 da OpenAI. Também é usado rotineiramente por profissionais de segurança cibernética para fins defensivos, diz a Anthropic.

O argumento mais amplo da Antrópico é que as suas salvaguardas mais fortes operam através de sistemas de classificação independentes que funcionam separadamente do próprio modelo, o que significa que mesmo que alguém convença Fable a continuar a falar após uma recusa, as proteções subjacentes contra os resultados mais perigosos permanecem em vigor.

Claramente, nada disso foi suficiente para impedir o governo de agir, e a Anthropic não esconde a sua frustração. “Discordamos que a descoberta de um potencial jailbreak restrito deveria ser motivo para o recall de um modelo comercial implantado para centenas de milhões de pessoas”, escreveu a empresa. “Se este padrão fosse aplicado em toda a indústria, acreditamos que basicamente interromperia todas as implantações de novos modelos para todos os fornecedores de modelos de fronteira.”

Espera-se que a Anthropic faça um IPO este ano e apostou grande parte de sua identidade pública em ser a alternativa consciente em termos de segurança aos seus rivais. A ironia não passa despercebida aos observadores de que a própria cautela que a Antrópica demonstrou ao restringir a Mythos – que promoveu como um modelo tão perigoso que não poderia ser divulgado publicamente – aparentemente atraiu agora exactamente o tipo de escrutínio governamental que mais poderia perturbar os seus negócios.

Sam Altman da OpenAI deve estar gostando disso, pelo menos. Em abril, ele disse ao podcaster Ashlee Vance que a forma como a Anthropic lidou com Mythos equivalia a “marketing baseado no medo”. “É claramente um marketing incrível dizer: ‘Construímos uma bomba. Estávamos prestes a jogá-la na sua cabeça. Vamos lhe vender um abrigo antiaéreo por US$ 100 milhões'”, disse Altman. Altman, cuja empresa também deverá realizar um IPO o mais rápido possível, não previu uma paralisação do governo, mas identificou algo que voltou a afetar a Antthropic por enquanto: quando você passa meses dizendo ao mundo que sua IA é excepcionalmente perigosa, o mundo – incluindo o governo dos EUA – tende a ouvir.

Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui