A área de demonstração do AI Sandbox no Google I/O
Radhika Rajkumar/ZDNET
Siga ZDNET: Adicione-nos como fonte preferencial no Google.
Principais conclusões da ZDNET
- Os muitos novos recursos de IA do Google abrangem várias interfaces.
- Recursos discretos substituíram as atualizações gerais do Gemini.
- Vários pontos de contato de função única podem ser confusos.
Neste ponto da corrida pela IA, a maioria dos laboratórios de IA descobriu que o verdadeiro dinheiro está nos casos de uso empresarial: grandes recursos de agência que impactam significativamente a maneira como as grandes empresas se movem e trabalham. O Google é um desses laboratórios, o que poderia explicar por que muitos dos recursos de IA mais voltados para o consumidor da empresa, revelados no I/O na terça-feira, parecem um tanto… desanimadores.
Também: A nova ferramenta Omni AI do Google permitirá que você mesmo clone vídeos – estou intrigado (e preocupado)
Não apenas isso, mas eles são estranhamente díspares no cenário já multifacetado de Gêmeos. Essa I/O, em particular, foi uma oportunidade para o Google tornar a IA cotidiana atraente para os usuários, especialmente aqueles que são céticos em relação ao quanto a empresa está pressionando-a. Embora esses novos recursos ofereçam algumas conveniências, o Google os empacotou de maneiras que podem prejudicar sua relevância e usabilidade.
Muitas vidas separadas
O Google Workspace obteve alguns novos recursos de IA no I/O, sendo os dois principais o Docs Live e o Gmail Live. E sim, eles têm efetivamente a mesma funcionalidade.
Assim como o Gemini Live, que permite usar a voz para interagir com o Gemini, o Docs Live e o Gmail Live permitem consultar cada aplicativo por voz.
Em uma demonstração, uma funcionária do Google usou o primeiro para gerar um documento do Google em seu telefone, reunido a partir de notas, apresentações e outras informações contextuais díspares que ela recitava na hora. Para demonstrar o último, ela fez perguntas ao Gmail como: “O que está acontecendo na escola esta semana?” O Gmail Live examinou sua caixa de entrada e respondeu que havia uma visita de campo para se preparar.
Também: Comparei como Gemini, ChatGPT e Claude podem analisar vídeos – este modelo vence
Ambos os recursos lidaram com questões de acompanhamento mais complexas sobre conflitos de agendamento e alteraram tópicos aparentemente sem confundir termos relacionados, como “viagem de campo” e “viagem a Detroit”. Mas essas são efetivamente funcionalidades do Gemini Live, aplicadas a novos aplicativos. Por que dar-lhes nomes distintos e isolá-los em lugares específicos? Por que não simplesmente expandir as integrações do Gemini Live?
Nenhum dos representantes do Google que perguntei no local poderia realmente responder a isso.
É uma abordagem estranha para tornar o Workspace mais acessível com IA quando, até agora, o Google tem colocado o Gemini em tudo. Independentemente de você gostar ou não, é uma abordagem limpa e de construção de autoridade que oferece aos usuários um balcão único para essas vantagens sutis, mas convenientes de IA (ou seja, quando elas funcionam). Além disso, o Gemini in Workspace já equipa o Gmail, o Docs e o Sheets com vários recursos – por que não colocá-los sob esse guarda-chuva, pelo menos?
Também: Seu telefone Android está recebendo poderes de agente com Gemini Intelligence – veja como e quando
Ao dividir funções quase idênticas em recursos separados, o Google corre o risco de confundir ou sobrecarregar a pessoa que precisa convencer: o cliente antigo do Google que está hesitante em relação à IA ou não tem certeza se ela é relevante para ele. Isso é muito mais fácil de fazer dizendo que o Gemini obtém informações para você de vários aplicativos por voz do que nomeando uma longa lista de títulos de produtos independentes.
O Google não está sozinho nisso: a Microsoft adicionou o Copilot à maioria de seus produtos existentes, deixando os usuários navegar pelas diferenças entre o Copilot Chat, o Microsoft 365 Copilot e outros termos sobrepostos. A OpenAI arriscou confusão semelhante quando lançou os aplicativos ChatGPT, que são apenas integrações do ChatGPT com outros aplicativos – e não um novo produto ou plataforma de criação de aplicativos como o nome poderia sugerir.
Além do mais, o Docs Live e o Gmail Live estão sendo lançados para assinantes AI Pro e Ultra – que pagam US$ 20 e pelo menos US$ 100 por mês, respectivamente – e estarão em versão prévia para usuários empresariais do Workspace neste verão. Não está claro se eles eventualmente chegarão a todos os usuários ou chegarão ao próprio Gemini.
Esses são casos de uso bastante específicos para lançamentos independentes, sem falar daqueles pelos quais os usuários precisarão pagar. Ambos parecem estar disponíveis apenas em dispositivos móveis, pelo menos por enquanto, focados em tornar as tarefas “on the go” mais fáceis.
Um breve resumo diário
Demonstração do recurso Daily Brief no Google I/O, 19 de maio.
Radhika Rajkumar/ZDNET
Adaptado de um experimento chamado CC, anunciado no final do ano passado, o novo recurso Daily Brief obtém informações de seu e-mail, calendário e outros aplicativos conectados para fornecer um resumo de como será seu dia. Para aqueles preocupados com reuniões alucinadas, também inclui links para onde em seu ecossistema foi retirado cada item da agenda.
Digo recurso, mas o Google chamou o Daily Brief de “um novo agente”. Não quero nos enterrar na semântica, mas a menos que esteja faltando alguma coisa, esse recurso não me parece estar à altura do padrão de agente que o OpenClaw estabeleceu este ano.
Também: Testei ChatGPT Plus vs. Gemini Pro para ver qual é melhor – e se vale a pena mudar
Para ser justo, o Daily Brief demonstra algum nível de raciocínio mais profundo: ainda não conseguimos testá-lo, mas em duas demonstrações separadas, ele foi além dos dias atuais para sinalizar as próximas cobranças para o final da semana. Também determinou que o usuário do teste estava prestes a reformar sua cozinha, sugerindo que montasse uma estação de cozinha temporária.
Mas foi aí que o “agente” parou. Quando perguntei se o recurso poderia agir a partir de algum desses itens, um funcionário do Google me disse que um usuário deveria simplesmente iniciar um bate-papo com o Gemini ou mudar para o Spark, o novo “agente pessoal” do Google que vive (de novo, de forma confusa) dentro do Gemini.
Não quero parecer um pirralho, mas… é isso?
Também: Como o Google renovou o Gemini Enterprise para a era da agência – aqui estão as novidades
Um briefing diário é produto do trabalho de resumo de um agente. Mas será o próprio briefing um agente? Pela definição do Google, não estou convencido (embora testes práticos possam revelar mais habilidades de agente). Embora a revisão de dados de seus aplicativos conectados exija recursos de agente, o Daily Brief é uma aplicação bastante restrita dessas habilidades.
No grande esquema das expectativas da IA, o Google também está um pouco atrasado.
“Uma das coisas pelas quais o OpenClaw é conhecido é sua capacidade de fornecer instruções diárias. As pessoas também usam Claude Cowork para isso”, disse David Gewirtz, colaborador da ZDNET. “Certamente não é uma capacidade nova no mundo da IA. As pessoas têm falado sobre briefings diários desde que os agentes começaram a se tornar utilizáveis”.
Dado esse contexto, tenho a mesma pergunta que tinha sobre as muitas vidas: por que não simplesmente lançar o Daily Brief no Gemini como um novo recurso (talvez há muito esperado)?
As ferramentas de IA precisam de clareza
Os vários níveis de capacidade do Gemini já estão divididos entre interfaces, separados apenas por nomes ligeiramente diferentes. Gemini Intelligence, um braço específico do agente para Android, foi lançado no início deste mês com recursos multitarefa de agente. A propósito, isso é diferente do Gemini Personal Intelligence, que personaliza suas respostas de consulta com base nos dados aos quais você dá acesso.
Depois, há o Gemini in Search e o aplicativo Gemini independente.
Também: Essa poderosa configuração do Gemini tornou meus resultados de IA muito mais pessoais e precisos
Essa configuração corre o risco de tornar o que o Gemini pode fazer tão ilegível que os usuários simplesmente se desligam. Tecnicamente falando, o Google pode separar cada um desses braços Gemini com base em seu desempenho em diferentes superfícies: para um desenvolvedor ou gerente de produto, pode fazer sentido distinguir a versão Android de um produto Gemini.
Mas do ponto de vista do marketing, talvez isso não precise ser tão visível para o consumidor.
Mesmo que os laboratórios de IA estejam agora seguindo o sucesso da Anthropic e se concentrando nas empresas, o campo das ferramentas de IA para o consumidor ainda é relevante – e lotado. Tornar mais difícil para os usuários manterem seus produtos em ordem provavelmente não ajuda.













