Nos últimos anos, a Índia mercado de entrega de comida on-line cresceu significativamente, com a abertura de capital da Zomato e da Swiggy e com um aumento no número de cozinhas na nuvem. Enquanto isso, as startups que trabalham em serviços domésticos, como plataformas de pessoal doméstico sob demanda, como Urban Company, Snabbit e Pronto, ganharam popularidade.
Startup baseada no Vale do Silício Arquivo Humano está aproveitando essa tendência, fazendo parceria com essas empresas para que os trabalhadores usem bonés especiais com câmeras para coletar dados de vídeo egocêntricos (ponto de vista em primeira pessoa) de tarefas diárias que poderiam ser usados para treinar robôs.
Sem nomear parceiros específicos, a startup disse que está trabalhando com empresas dos setores de serviços domésticos, albergues e restaurantes para coletar dados egocêntricos, e afirma ter mais de 1.000 fones de ouvido ativos implantados em vários locais.
Com base nessa tração, o Human Archive disse na terça-feira que levantou US$ 8,2 milhões em financiamento da Wing Venture Capital, NVP Capital, Y Combinator e anjos da OpenAI, Nvidia, Google, Mercor, AfterQuery, BAIR, SAIL, Brad Boa e Meta.
A startup foi fundada por dois estudantes de Berkeley e dois de Stanford – Samay Mani, Rushil Agarwal, Shloke Patel e Raj Patel, sendo os dois últimos primos. (Raj Patel é CEO.) Todos os quatro têm experiência em pesquisa que abrange robótica, hardware e dados táteis.
A fundação da empresa é uma aposta direta no rumo que a indústria de IA está tomando. À medida que os laboratórios de robótica e as empresas pioneiras de IA correm para construir máquinas que possam realizar tarefas físicas no mundo real, enfrentam um estrangulamento crítico: uma escassez de dados de treino de alta qualidade do mundo real que mostrem humanos a realizar o trabalho diário. A aposta da Human Archive é que os trabalhadores que trabalham na crescente economia gig da Índia representem uma fonte inexplorada e escalável exatamente desses dados.
Embora a Human Archive esteja trabalhando com vários parceiros, a startup disse que foi rejeitada por muitas empresas indianas de serviços domésticos, incluindo Pronto e Urban Company, para colaboração.
A rejeição da empresa por parte de grandes players tornou-se assunto público no fim de semana passado, quando o outlet indiano Entrackr relatado que o Pronto está buscando ativamente parcerias para coletar dados de trabalhadores para treinamento em robótica e que o Snabbit manteve discussões iniciais com o Human Archive antes do projeto desmoronar.
CEO da empresa urbana, Abhiraj Singh Bhal respondeu em X, afirmando que a empresa não se envolveria em tais acordos – levando Patel a revide que a Urban Company logo seria forçada a reconsiderar ou correria o risco de perder relevância devido à rotatividade de clientes. O cofundador Rushil Agarwal foi ainda mais direto, postando que o fundador do Pronto, Anjali Sardana, havia sorriu para ele e o chamou de “estúpido” quando levantou a ideia de uma parceria de dados. Pronto reconheceu as conversas, mas disse que optou por não seguir em frente.
Em todo o país, outras startups estão coletando dados egocêntricos de diferentes ambientes de trabalhoincluindo pisos de fábrica. Para se diferenciar, a Human Archive está usando e desenvolvendo dispositivos adicionais, como luvas táteis, um traje de captura de movimento de corpo inteiro e câmeras de pulso para capturar dados, incluindo movimento e força tátil, alinhados de forma síncrona com RGB-D (imagens coloridas emparelhadas em tempo real com informações profundas), para vender a laboratórios de IA. A startup acredita que os dados de vídeo por si só não são suficientes, mas que combiná-los com outros dados de sensores os torna muito mais valiosos.
Inicialmente, o Human Archive usou configurações improvisadas ou equipamentos prontos para uso para capturar os dados. Agora, está trabalhando em hardware customizado que funciona em conjunto e captura diferentes tipos de dados. Já possui mais de 50 dispositivos diferentes implantados para coletar diferentes pontos de dados.
“Para capturar dados, começamos com iPhones, depois construímos nossos próprios equipamentos e bonés personalizados. Agora temos mais de sete produtos de hardware diferentes que usamos de forma intercambiável em diferentes modalidades. Após a coleta de dados de diferentes dispositivos, trabalhamos na sincronização de dados de todas essas fontes diferentes”, disse Patel em uma ligação.
A empresa disse que está desenvolvendo maneiras de ajustar modelos de IA com seus próprios dados e testá-los em robôs para avaliar a eficácia das tarefas. Ao fazer isso, a startup pode demonstrar a qualidade de seus dados para potenciais clientes e pós-treinar modelos internos.
Zach DeWitt, sócio da Wing VC, disse que a startup tem uma vantagem única na coleta de dados de vários sensores.
“Ninguém mais no mundo foi capaz de sincronizar e coletar fones de ouvido RGB-D, feedback de força, captura de movimento de corpo inteiro e dados sincronizados de câmeras de tórax e pulso em escala. Eles têm treinado modelos internos com esses dados, e todos os grandes laboratórios e universidades estão interessados em realizar experimentos com eles devido à novidade dos sensores e à escala do novo conjunto de dados que serão lançados em breve”, disse ele ao TechCrunch.
Coleta de dados na Índia e planos de expansão
Apesar da rejeição de players notáveis do setor de serviços domésticos, a Human Archive se uniu a startups menores para oferecer serviços com descontos aos clientes. Quando um trabalhador chega a uma casa, os consumidores têm a opção de escolher através do aplicativo: pagar um preço com desconto em troca de consentimento para a coleta de dados ou pagar o preço total por uma visita não registrada.
Patel mencionou que os clientes ficaram felizes em optar pela primeira opção, pois as disputas sobre a qualidade do serviço são comuns e as gravações de vídeo podem ajudar a resolvê-las.
A empresa paga aos trabalhadores uma taxa básica de US$ 1 por hora pela participação na coleta de dados egocêntrica. Um relatório do Economic Times sugere que outras empresas pagam ₹250 a ₹400 por hora (cerca de US$ 2,63 a US$ 4,20). Patel disse que os concorrentes pagam mais do que a Human Archive, mas sua presença local na Índia permite manter a remuneração mais baixa.
“A rede do Human Archive oferece oportunidades de ganhos imediatos e flexíveis em todo o mundo, reduzindo a barreira à participação na economia da IA. Vemos isto como uma ponte crítica que financia meios de subsistência imediatos enquanto constrói a infra-estrutura para um futuro mais seguro e produtivo”, disse DeWitt.
Além do pagamento de salários, existem preocupações de privacidade em torno da recolha de dados através de gravação de vídeo. Não está claro quais informações o Human Archive fornece aos trabalhadores sobre como suas filmagens são usadas. A empresa disse que seus contratos comerciais estão em conformidade com as normas da Índia Lei de Proteção de Dados Pessoais Digitais (DPDP)pois exibe um aviso de política de privacidade, juntamente com informações de consentimento detalhando a finalidade da coleta de dados e como ela é processada. A empresa disse que todos os dados são anonimizados, e os rostos ficam desfocados nas gravações. Na semana passada, Moneycontrol relatado que o Ministério de Eletrônica e Tecnologia da Informação da Índia está investigando os mecanismos de consentimento e as práticas de coleta de dados de startups que coletam dados egocêntricos por meio de trabalhadores de serviços domésticos.
Embora o Human Archive colete dados em grande parte na Índia, ele começou a se expandir para o Sudeste Asiático e os EUA. A empresa também está construindo uma plataforma para qualquer pessoa participar da coleta de dados e ganhar dinheiro. Também pretende oferecer aos clientes nos EUA serviços como limpeza ou cozinha em troca da recolha de dados pelos trabalhadores participantes – embora estes programas estejam apenas numa fase piloto inicial.
Várias startups bem financiadas estão correndo para construir IA física. Fazer isso requer enormes quantidades de dados de treinamento que mostram humanos trabalhando – e o Human Archive é um dos participantes que competem para atender a essa demanda. A escalabilidade da sua abordagem dependerá das parcerias que estabelecer e da singularidade e do volume dos dados que puder recolher para satisfazer o apetite dos laboratórios físicos de IA.
Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.













