Início Tecnologia O próximo gargalo da IA ​​não são os modelos – é se...

O próximo gargalo da IA ​​não são os modelos – é se os agentes podem pensar juntos

25
0

Os agentes de IA podem se conectar, mas não podem pensar juntos. Essa é uma enorme diferença e um gargalo para os sistemas de próxima geração, afirma Outshift, do vice-presidente sênior e gerente geral da Cisco, Vijoy Pandey.

Conforme ele descreve o estado atual da IA: Os agentes podem ser unidos em um fluxo de trabalho ou conectados a um modelo de supervisor — mas não há alinhamento semântico, nem contexto compartilhado. Eles estão essencialmente trabalhando do zero a cada tentativa.

Isto exige infraestrutura de próximo nível, ou o que Pandey descreve como a “Internet da cognição”.

“Os agentes não conseguem pensar juntos porque conexão não é cognição”, disse ele. “Precisamos chegar a um ponto em que você compartilhe a cognição. Esse é o desbloqueio maior.”

Criação de novos protocolos para oferecer suporte à comunicação de agente de última geração

Então, o que é cognição compartilhada? É quando agentes ou entidades de IA podem trabalhar juntos de forma significativa para resolver algo novo para o qual não foram treinados, e fazer isso “100% sem intervenção humana”, disse Pandey no último episódio de Além do piloto.

O executivo da Cisco faz uma analogia com a inteligência humana. Os seres humanos evoluíram ao longo de centenas de milhares de anos, primeiro tornando-se inteligentes individualmente e depois comunicando-se num nível básico (com gestos ou desenhos). Essa comunicação melhorou ao longo do tempo, acabando por desbloquear uma “revolução cognitiva” e uma inteligência colectiva que permitiu a intenção partilhada e a capacidade de coordenar, negociar, fundamentar e descobrir informações.

“Intenção compartilhada, contexto compartilhado, inovação coletiva: essa é exatamente a trajetória que está acontecendo no silício hoje”, disse Pandey.

Sua equipe vê isso como um “problema de assistência distribuída horizontalmente”. Estão a perseguir uma “superinteligência distribuída”, codificando a intenção, o contexto e a inovação colectiva como um conjunto de regras, APIs e capacidades dentro da própria infra-estrutura.

A sua abordagem é um conjunto de novos protocolos: Protocolo de Transferência de Estado Semântico (SSTP); Protocolo de Transferência Espacial Latente (LSTP); e Protocolo de Transferência de Estado Comprimido (CSTP).

O SSTP opera no nível da linguagem, analisando a comunicação semântica para que os sistemas possam inferir a ferramenta ou tarefa certa. A equipe de Pandey colaborou recentemente com o MIT em uma peça relacionada chamada Protocolo de Efeito Ripple.

O LSTP pode ser usado para transferir “todo o espaço latente” de um agente para outro, explicou Pandey. “Podemos simplesmente pegar o cache KV e enviá-lo como exemplo?” ele disse. “Porque essa seria a maneira mais eficiente: em vez de passar pela taxa de tokenização, ir para uma linguagem natural e depois voltar a pilha do outro lado.”

O CSTP lida com a compactação – ancorando apenas as variantes alvo enquanto compacta todo o resto. Pandey diz que é particularmente adequado para implantações de borda onde você precisa enviar grandes quantidades de estado com precisão.

Em última análise, a equipe de Pandey está construindo uma estrutura para ampliar a inteligência e garantir que os estados de cognição sejam sincronizados entre os terminais. Além disso, estão a desenvolver o que chamam de “motores de cognição” que fornecem barreiras de proteção e sistemas de aceleração.

“Protocolos, estrutura, motores de cognição: essas são as três camadas que estamos construindo na busca por superinteligência distribuída”, disse Pandey.

Como a Cisco resolveu um grande problema

Afastando-se desses sistemas avançados e de próximo nível, a Cisco alcançou resultados tangíveis com os recursos de IA existentes. Pandey descreveu um ponto problemático específico com a equipe de engenharia de confiabilidade do site (SRE) da empresa.

Embora produzissem cada vez mais produtos e códigos, a equipe em si não crescia e sentia pressão para melhorar a eficiência. Pandey introduziu agentes de IA que automatizaram mais de uma dúzia de fluxos de trabalho ponta a ponta, incluindo pipelines de CI/CD de integração/entrega contínua, spin-ups de instâncias EC2 e implantações de cluster Kubernetes.

Agora, mais de 20 agentes – alguns criados internamente, outros de terceiros – têm acesso a mais de 100 ferramentas por meio de estruturas como o Model Context Protocol (MCP), ao mesmo tempo que se conectam às plataformas de segurança da Cisco.

O resultado: uma diminuição de “horas e horas para segundos” com determinadas implantações; além disso, os agentes reduziram 80% dos problemas que a equipe SRE via nos fluxos de trabalho do Kubernetes.

Ainda assim, como observou Pandey, a IA é uma ferramenta como qualquer outra. “Isso não significa que eu tenha um martelo novo e que vou apenas sair por aí procurando pregos”, disse ele. “Você ainda tem um código determinístico. Você precisa casar esses dois mundos para obter o melhor resultado para o problema que está resolvendo.”

Ouça o podcast para saber mais sobre:

  • Como estamos agora possibilitando um novo paradigma de computação não determinística.

  • Como a Cisco aumentou os recursos de detecção de erros em grandes redes de 10% para 100%.

  • Como Pandey nomeou seu próprio agente de IA “Arnold Layne” em homenagem a uma das primeiras músicas do Pink Floyd.

  • Por que a “Internet da cognição” deve ser um esforço aberto e interoperável.

  • Como funciona o projeto de código aberto da Cisco Agntcy aborda descoberta, gerenciamento de identidade e acesso (IAM), observabilidade e avaliação.

Você também pode ouvir e assinar Além do piloto sobre Spotify, Maçã ou onde quer que você obtenha seus podcasts.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui