Início Tecnologia Conheça Claude Mythos: postagem vazada da Anthropic revela o poderoso modelo que...

Conheça Claude Mythos: postagem vazada da Anthropic revela o poderoso modelo que está por vir

25
0

Um vazamento acidental agora foi oficialmente confirmado pela empresa de IA Antrópica em relação ao seu modelo de IA mais poderoso até agora.

O modelo, agora conhecido como “Claude Mythos”, foi originalmente descoberto em um relatório do Fortuna. Desde então, a Anthropic confirmou os detalhes sobre o vazamento para o outlet.

O vazamento de dados incluiu detalhes sobre o próximo lançamento do modelo de IA de Claude Mythos, um “evento exclusivo para CEOs”, e outros ativos internos, como PDFs e imagens, de acordo com Fortuna. No total, o vazamento incluiu quase 3.000 ativos que a Antrópico não havia publicado anteriormente.

Detalhes do vazamento de Claude Mythos

Segundo a Anthropic, o vazamento foi resultado de um problema no sistema de gerenciamento de conteúdo (CMS) que a empresa utiliza. Os dados foram carregados no CMS pela empresa. No entanto, a Anthropic não conseguiu marcar os itens como privados, então os dados foram armazenados em um data lake acessível ao público.

VEJA TAMBÉM:

A Antthropic quer contratar um especialista em armas. Não é o que você pensa.

Alguns dos dados eram ativos não utilizados de anúncios anteriores da Anthropic. Outros dados vazados foram informações corporativas internas, como detalhes de funcionários ou informações sobre um evento de CEO somente para convidados.

No entanto, também foram encontradas informações sobre Claude Mythos nos dados vazados em um rascunho de postagem de blog não publicado.

Claude Mythos e Capivara

De acordo com o rascunho vazado sobre Claude Mythos, a Anthropic concluiu o treinamento do modelo e se refere a ele como “de longe o modelo de IA mais poderoso que já desenvolvemos”.

Em uma declaração fornecida à Fortune após o vazamento, um porta-voz da Anthropic descreveu Claude Mythos como uma “mudança radical” no desempenho da IA ​​e disse que o modelo é “o mais capaz que construímos até agora”. A Anthropic diz que Claude Mythos está atualmente em fase de teste e disponível para selecionar “clientes de acesso antecipado”.

VEJA TAMBÉM:

Anthropic processa Pentágono enquanto downloads de Claude disparam

Além do novo modelo de IA, a postagem vazada também menciona um novo e inédito nível de modelo de IA da Anthropic, chamado Capivara.

A Anthropic oferece atualmente três níveis diferentes para cada um de seus modelos de IA: Opus, Sonnet e Haiku. Opus é atualmente o nível mais poderoso e mais caro, enquanto o Haiku é o menor e mais barato. A Capivara ficaria ainda acima da Opus como o maior e mais inteligente nível de modelo de IA da Antrópico.

Riscos de segurança cibernética da capivara

A postagem vazada também detalha as preocupações da Anthropic sobre os riscos de segurança cibernética que Claude Mythos traz para a mesa. Parece que a Anthropic acredita que Claude Mythos poderia ser usado por hackers para realizar ataques cibernéticos.

“Ao nos prepararmos para libertar Claude Capivara, queremos agir com cautela extra e compreender os riscos que isso representa – mesmo além do que aprendemos em nossos próprios testes”, diz o post vazado da Antrópico. “Em particular, queremos compreender os potenciais riscos de curto prazo do modelo no domínio da segurança cibernética – e partilhar os resultados para ajudar os defensores cibernéticos a prepararem-se.”

A Anthropic descreveu seu modelo não lançado como “atualmente muito à frente de qualquer outro modelo de IA em capacidades cibernéticas” e que o modelo “pressugia uma onda futura de modelos que podem explorar vulnerabilidades de maneiras que superam em muito os esforços dos defensores”.

A empresa disse no rascunho do blog que vazou que estava fornecendo acesso antecipado à organização para dar-lhes “uma vantagem inicial na melhoria da robustez de suas bases de código contra a onda iminente de explorações orientadas por IA”.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui