Início Tecnologia Google sacode sua equipe de agentes de navegador em meio à mania...

Google sacode sua equipe de agentes de navegador em meio à mania do OpenClaw

38
0

Google está tremendo formou a equipe por trás do Project Mariner, seu agente de IA que pode navegar no navegador Chrome e concluir tarefas em nome do usuário, descobriu a WIRED. Nos últimos meses, alguns funcionários do Google Labs que trabalharam no protótipo de pesquisa passaram para projetos de maior prioridade, segundo duas pessoas familiarizadas com o assunto.

Um porta-voz do Google confirmou as mudanças, mas disse que os recursos de uso do computador desenvolvidos no Projeto Mariner serão incorporados à estratégia de agentes da empresa no futuro. O Google já incorporou alguns desses recursos em outros produtos de agentes, incluindo o recém-lançado Agente Gêmeosacrescentou o porta-voz.

A mudança ocorre no momento em que o Google e outros laboratórios de IA correm para responder à ascensão de agentes altamente capazes como o OpenClaw. Embora essas ferramentas sejam usadas principalmente por desenvolvedores hoje, o Vale do Silício acredita que em breve poderão capacitar assistentes de uso geral para pessoas e empresas. O CEO da Nvidia, Jensen Huang, comparou a ferramenta a um novo sistema operacional para computadores agentes. “Todas as empresas no mundo hoje precisam ter uma estratégia OpenClaw”, disse ele na conferência de desenvolvedores da empresa no início desta semana.

O CEO do Google, Sundar Pichai, destacou o Project Mariner durante a conferência I/O do ano passado. Na época, os agentes de navegador pareciam ser a próxima grande aposta da indústria, com OpenAI e Perplexity lançando agentes de consumo que prometiam automatizar tarefas online para os usuários. Os agentes podiam clicar, rolar e preencher formulários em uma página da web, como um ser humano. No entanto, a adoção destes produtos tem lutado para atender às expectativas da indústria.

O agente do navegador Comet da Perplexity atingiu apenas 2,8 milhões de usuários ativos semanais em dezembro de 2025. Enquanto isso, o agente ChatGPT da OpenAI supostamente caiu para menos de 1 milhão de usuários ativos semanais nos últimos meses. Em comparação com as centenas de milhões de usuários que conversam semanalmente com o ChatGPT, o uso do agente do navegador equivale essencialmente a um erro de arredondamento.

Novos agentes na cidade

O impulso no mundo da IA ​​mudou drasticamente no ano passado em direção a agentes como Claude Code e OpenClaw (cujo criador foi contratado pela OpenAI). Ao contrário dos agentes de navegação na Web, esses sistemas controlam os computadores por meio da linha de comando, o que provou ser uma forma mais confiável de concluir tarefas. Alguns desses produtos incluem o uso do computador como recurso, entre outras habilidades de agente. Em comparação, os agentes de navegador agora parecem um tanto limitados como produtos independentes.

Kian Katanforoosh, CEO da plataforma de qualificação de IA Workera, que dá palestras sobre IA em Stanford, diz que parte do motivo pelo qual os agentes de uso de computador não decolaram é por causa de seus enormes requisitos computacionais. A maioria desses agentes trabalha fazendo uma série de capturas de tela de uma página da Web, inserindo-as em um modelo de IA e, em seguida, executando ações com base no que veem. O processamento de todas essas informações pode ser lento e, às vezes, pouco confiável.

“O que Claude Code e OpenClaw mostraram foi que na verdade é muito mais eficiente trabalhar com o terminal, porque o terminal é baseado em texto e os LLMs são baseados em texto”, disse Katanforoosh. “São provavelmente 10 a 100 vezes menos etapas para chegar aos mesmos resultados.”

Isso não quer dizer que os agentes de navegador não estejam melhorando ou que a pesquisa sobre o uso do computador tenha chegado a um beco sem saída.

No mês passado, a startup Standard Intelligence lançou um modelo de uso do computador treinado em vídeos, em vez de capturas de tela. A startup afirma ter desenvolvido um codificador de vídeo que pode compactar vídeos na janela de contexto de um modelo de IA, que afirma ser 50 vezes mais eficiente do que os modelos anteriores de uso de computador. Para mostrar as capacidades do seu modelo de IA, a startup conectou-o a um carro, a um vídeo ao vivo e a um teclado de computador. O modelo foi capaz de brevemente dirija de forma autônoma por São Francisco.

fonte