Início Entretenimento Por que a IA não transformou nossas vidas em 2025

Por que a IA não transformou nossas vidas em 2025

53
0

Há um ano, Sam Altman, CEO da OpenAI, fez uma previsão ousada: “Acreditamos que, em 2025, poderemos ver os primeiros agentes de IA ‘juntarem-se à força de trabalho’ e alterar materialmente a produção das empresas”. Algumas semanas depois, o diretor de produtos da empresa, Kevin Weil, disse na conferência do Fórum Econômico Mundial em Davos, em janeiro: “Acho que 2025 será o ano em que deixaremos o ChatGPT ser uma coisa superinteligente… para o ChatGPT fazer coisas no mundo real para você”. Ele deu exemplos de inteligência artificial preenchendo formulários online e fazendo reservas em restaurantes. Mais tarde, ele prometeu: “Seremos capazes de fazer isso, sem dúvida”. (A OpenAI tem parceria corporativa com a Condé Nast, proprietária da O nova-iorquino.)

Isso não era pouca coisa. Os chatbots podem responder diretamente a um prompt baseado em texto – respondendo a uma pergunta, por exemplo, ou escrevendo um rascunho de um e-mail. Mas um agente, em teoria, seria capaz de navegar sozinho no mundo digital e realizar tarefas que exigem múltiplas etapas e o uso de outros softwares, como navegadores da web. Considere tudo o que envolve fazer uma reserva de hotel: decidir as noites certas, filtrar com base nas preferências, ler avaliações, pesquisar vários sites para comparar tarifas e comodidades. Um agente poderia automatizar todas essas atividades. As implicações de tal tecnologia seriam imensas. Os chatbots são convenientes para uso de funcionários humanos; agentes de IA eficazes podem substituir completamente os funcionários. O CEO da Salesforce, Marc Benioff, que afirmou que metade do trabalho na sua empresa é feito por IA, previu que os agentes ajudarão a desencadear uma “revolução do trabalho digital”, no valor de biliões de dólares.

2025 em revisão

Os escritores da New Yorker refletem sobre os altos e baixos do ano.

2025 foi anunciado como o Ano do Agente de IA em parte porque, no final de 2024, estas ferramentas tinham-se tornado inegavelmente adeptas da programação de computadores. Uma demonstração do agente Codex da OpenAI, de maio, mostrou um usuário solicitando que a ferramenta modificasse seu site pessoal. “Adicione outra guia ao lado de investimentos/ferramentas chamada ‘comida que eu gosto’. No documento coloque – tacos”, escreveu o usuário. O chatbot executou rapidamente uma sequência de ações interligadas: revisou os arquivos no diretório do site, examinou o conteúdo de um arquivo promissor e, em seguida, usou um comando de pesquisa para encontrar o local certo para inserir uma nova linha de código. Depois que o agente aprendeu como o site estava estruturado, ele usou essas informações para adicionar com sucesso uma nova página com tacos. Como cientista da computação, tive que admitir que o Codex estava lidando com a tarefa mais ou menos como eu faria. Silicon Valley ficou convencido de que outras tarefas difíceis seriam em breve conquistadas.

No entanto, à medida que 2025 termina, a era dos agentes de IA de uso geral não conseguiu emergir. Neste outono, Andrej Karpathy, cofundador da OpenAI, que deixou a empresa e iniciou um projeto de educação em IA, descreveu os agentes como “cognitivamente deficientes” e disse: “Simplesmente não está funcionando”. Gary Marcus, um crítico de longa data do hype da indústria de tecnologia, escreveu recentemente em seu Substack que “os agentes de IA, até agora, têm sido em grande parte um fracasso”. Essa lacuna entre a previsão e a realidade é importante. Chatbots fluentes e geradores de vídeo que distorcem a realidade são impressionantes, mas não podem, por si só, inaugurar um mundo em que as máquinas assumam muitas das nossas atividades. Se as principais empresas de IA não conseguirem fornecer agentes amplamente úteis, poderão não conseguir cumprir as suas promessas de um futuro impulsionado pela IA.

O termo “agentes de IA” evoca ideias de novas tecnologias sobrecarregadas que lembram “Matrix” ou “Missão: Impossível – O Acerto de Contas Final”. Na verdade, os agentes não são uma espécie de cérebro digital personalizado; em vez disso, eles são alimentados pelo mesmo tipo de modelo de linguagem amplo usado pelos chatbots. Quando você pede a um agente para realizar uma tarefa, um programa de controle – um aplicativo simples que coordena as ações do agente – transforma sua solicitação em um prompt para um LLM Aqui está o que quero realizar, aqui estão as ferramentas disponíveis, o que devo fazer primeiro? O programa de controle então tenta quaisquer ações sugeridas pelo modelo de linguagem, informa sobre o resultado e pergunta: Agora o que devo fazer? Este ciclo continua até que o LLM considere a tarefa concluída.

Essa configuração é excelente na automatização do desenvolvimento de software. A maioria das ações necessárias para criar ou modificar um programa de computador pode ser implementada inserindo um conjunto limitado de comandos em um terminal baseado em texto. Esses comandos instruem um computador a navegar em um sistema de arquivos, adicionar ou atualizar texto em arquivos de origem e, se necessário, compilar código legível por humanos em bits legíveis por máquina. Este é um cenário ideal para LLMs “A interface do terminal é baseada em texto, e esse é o domínio em que os modelos de linguagem são baseados”, disse-me Alex Shaw, co-criador do Terminal-Bench, uma ferramenta popular usada para avaliar agentes de codificação.

Assistentes mais generalizados, do tipo imaginado por Altman, exigiriam que os agentes abandonassem as restrições confortáveis ​​do terminal. Como a maioria de nós realiza tarefas de computador apontando e clicando, uma IA que possa “juntar-se à força de trabalho” provavelmente precisará saber usar um mouse – uma meta surpreendentemente difícil. O Tempos recentemente relatado numa série de novas startups que têm construído “sites sombra” – réplicas de páginas populares, como as da United Airlines e do Gmail, nas quais a IA pode analisar como os humanos usam um cursor. Em julho, a OpenAI lançou o ChatGPT Agent, uma versão inicial de um bot que pode usar um navegador da web para concluir tarefas, mas uma análise observou que “mesmo ações simples como clicar, selecionar elementos e pesquisar podem levar vários segundos – ou até minutos”. A certa altura, a ferramenta travou por quase um quarto de hora tentando selecionar um preço no menu suspenso de um site imobiliário.

fonte