Início Tecnologia Seus próximos fones de ouvido poderão traduzir texto e identificar objetos para...

Seus próximos fones de ouvido poderão traduzir texto e identificar objetos para você

24
0

Pesquisadores da Universidade de Washington desenvolveram um novo protótipo de sistema que pode mudar a forma como as pessoas interagem com a inteligência artificial na vida diária. Chamado de VueBuds, o sistema integra pequenas câmeras em fones de ouvido sem fio padrão, permitindo que os usuários façam perguntas a um modelo de IA sobre o mundo ao seu redor quase em tempo real.

O conceito é simples, mas poderoso. Um usuário pode olhar para um objeto, como uma embalagem de comida em um idioma estrangeiro, e pedir à IA que o traduza. Em cerca de um segundo, o sistema responde através dos fones de ouvido, criando uma interação perfeita e com as mãos livres.

Uma abordagem diferente para wearables de IA

Ao contrário dos óculos inteligentes, que tiveram dificuldades para serem adotados devido a questões de privacidade e limitações de design, o VueBuds adota uma abordagem mais sutil. O sistema usa câmeras em preto e branco de baixa resolução incorporadas em fones de ouvido para capturar imagens estáticas em vez de vídeo contínuo.

Essas imagens são transmitidas via Bluetooth para um dispositivo conectado, onde um pequeno modelo de IA as processa localmente. Esse processamento no dispositivo garante que os dados não precisem ser enviados para a nuvem, abordando uma das maiores preocupações em torno das câmeras vestíveis.

Para aumentar ainda mais a privacidade, os fones de ouvido incluem uma luz indicadora visível durante a gravação e permitem que os usuários excluam as imagens capturadas instantaneamente.

Engenharia em torno dos limites de potência e desempenho

Um dos maiores desafios que a equipe de pesquisa enfrentou foi o consumo de energia. As câmeras requerem significativamente mais energia do que os microfones, tornando impraticável o uso de sensores de alta resolução como os encontrados em óculos inteligentes.

Para resolver isso, a equipe usou uma câmera aproximadamente do tamanho de um grão de arroz, capturando imagens em escala de cinza de baixa resolução. Essa abordagem reduz o uso da bateria e permite uma transmissão Bluetooth eficiente sem comprometer a capacidade de resposta.

A colocação foi outra consideração importante. Ao inclinar as câmeras ligeiramente para fora, o sistema atinge um campo de visão entre 98 e 108 graus. Embora exista um pequeno ponto cego para objetos mantidos extremamente próximos, os pesquisadores descobriram que isso não afeta o uso normal.

O sistema também combina imagens de ambos os fones de ouvido em um único quadro, melhorando a velocidade de processamento. Isso permite que o VueBuds responda em cerca de um segundo, em comparação com dois segundos ao lidar com imagens separadamente.

Desempenho comparado aos óculos inteligentes

Nos testes, 74 participantes compararam o VueBuds com óculos inteligentes, como os modelos Ray-Ban da Meta. Apesar de usar imagens de resolução mais baixa e processamento local, o VueBuds teve um desempenho geral semelhante.

O relatório mostrou que os participantes preferiram os VueBuds para tarefas de tradução, enquanto os óculos inteligentes tiveram melhor desempenho na contagem de objetos. Em testes separados, o VueBuds alcançou taxas de precisão de cerca de 83–84% para tradução e identificação de objetos, e até 93% para identificação de títulos de livros e autores.

Por que isso é importante e o que vem a seguir

A pesquisa destaca uma mudança potencial na forma como os wearables alimentados por IA são projetados. Ao incorporar inteligência visual num dispositivo que as pessoas já utilizam, o sistema evita muitas das barreiras enfrentadas pelos óculos inteligentes.

No entanto, as limitações permanecem. O sistema atual não consegue interpretar cores e suas capacidades ainda estão em estágios iniciais. A equipe planeja explorar a adição de sensores de cores e o desenvolvimento de modelos de IA especializados para tarefas como tradução e suporte de acessibilidade.

Os pesquisadores apresentarão suas descobertas na Conferência sobre Fatores Humanos em Sistemas de Computação da Association for Computing Machinery, em Barcelona, ​​oferecendo um vislumbre de um futuro onde os dispositivos do dia a dia se tornarão silenciosamente assistentes inteligentes.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui