Início Tecnologia O novo Kimi K2.6 da Moonshot AI envolve suas tarefas complexas com...

O novo Kimi K2.6 da Moonshot AI envolve suas tarefas complexas com 1.000 agentes colaboradores

40
0

Bloomberg / Contribuidor via Bloomberg / Getty Images

Siga ZDNET: Adicione-nos como fonte preferencial no Google.


Principais conclusões da ZDNET

  • Moonshot AI leva a codificação autônoma a novos limites.
  • A IA projeta e cria aplicativos full-stack a partir de prompts.
  • Agentes persistentes funcionam por dias, lidando com operações reais.

Ontem, Moonshot AI anunciou Kimi K2.6a versão mais recente de seu modelo de IA de código aberto. Esta versão possui recursos de codificação aprimorados, execução de operações longas em várias etapas e recursos de enxame de agentes (o que não parece nada assustador).

Além disso: A melhor IA gratuita para codificação – apenas 3 passam agora

A empresa está redobrando o que chama de “experiência perfeita de colega de trabalho de IA”, com base em uma reinterpretação da abordagem do assistente de IA OpenClaw para processamento automatizado de IA para fluxos de trabalho complexos do mundo real.

Melhorias no desempenho da codificação de longo horizonte

No centro do lançamento do Kimi K2.6 está uma melhoria substancial no desempenho de codificação de longo horizonte. A codificação de longo horizonte é outra maneira de dizer que a IA pode realizar uma série muito longa de etapas sem supervisão humana.

Pense na diferença entre horizonte curto e horizonte longo como análoga à diferença entre ter um funcionário que você precisa verificar a cada 15 minutos e um funcionário a quem você pode simplesmente atribuir uma tarefa e saber que o que você precisa estará em sua mesa amanhã de manhã sem complicações ou complicações.

Além disso: 7 técnicas de codificação de IA que uso para enviar produtos reais e confiáveis ​​- rápido

Moonshot usa um projeto do compilador SysY como exemplo de atribuição de longo horizonte. SysY é uma linguagem minimalista do tipo C usada para ensinar design de compiladores aos alunos. Kimi K2.6 projetou e construiu um compilador SysY completo do zero em 10 horas, passando por 140 testes funcionais sem intervenção humana. Diz que este trabalho equivale a ter quatro engenheiros trabalhando durante dois meses.

Sem dúvida, esta é uma conquista considerável. Mas Moonshot não está sozinho no uso de IA para construir compiladores. A Antthropic informou em fevereiro que construiu um compilador C completo (não apenas uma versão reduzida de rodinhas) usando seu modelo Opus 4.6.

O projeto Antrópico teve um bom desempenho, mas encontrou um obstáculo quando os agentes enfrentaram a complexa tarefa de compilar o kernel do Linux, fazendo com que ficassem presos nos mesmos bugs, sobrescrevessem o trabalho uns dos outros e quebrassem a funcionalidade existente à medida que novos recursos eram adicionados.

Suponho que a escolha do SysY por parte dos desenvolvedores do Kimi foi para manter a complexidade geral baixa, e que este novo modelo provavelmente encontraria um conjunto de obstáculos semelhantes aos encontrados pela Antrópico.

Moonshot diz que o modelo K2.6 demonstra forte generalização (o que significa que é capaz de lidar com situações novas e inesperadas em linguagens como Rust, Go e Python). Ele também relata que o novo modelo demonstra confiabilidade em tarefas de front-end, DevOps e otimização de desempenho.

Expandindo da codificação para o design e criação

A saída de codificação não é o único grande truque do Kimi K2.6. O modelo é capaz de realizar o trabalho de design da interface do usuário e, em seguida, produzir saída de codificação desse design. Isso permite que não programadores criem aplicativos da Web completos a partir de prompts, incluindo a aparência. Ele fornece assistência a desenvolvedores que podem não ter experiência em design.

Além disso: tentei economizar US$ 1.200 com vibe coding de graça – e rapidamente me arrependi

Voltando à afirmação de longo horizonte discutida anteriormente, Moonshot demonstrou a capacidade do projeto em grande escala construindo uma série de sites. A empresa informou que Kimi K2.6, “identificou 30 restaurantes em Los Angeles sem sites oficiais e, em seguida, gerou automaticamente páginas de destino de alta conversão para cada um. Essas páginas incluem funcionalidade de reserva, com todas as informações perfeitamente sincronizadas com seu banco de dados”.

Enxames de agentes, agentes proativos e execução persistente

De acordo com o fundador da Moonshot AI, Zhilin Yang, “Ao orquestrar 100 ou até 1.000 subagentes em paralelo, podemos realizar tarefas complexas dentro de um prazo que seja tolerável para o mundo real”. Ele chama isso de “enxames de agentes”.

Não sei. Provavelmente já vi o Exterminador do Futuro muitas vezes, mas embora possa ver o benefício prático, a própria ideia de enxames de agentes de IA é assustadora demais.

A empresa relata: “Ele coordena perfeitamente agentes heterogêneos para combinar habilidades complementares e amplos recursos de pesquisa em camadas com pesquisa profunda, além de análise de documentos em grande escala combinada com escrita longa e geração de conteúdo multiformato executada em paralelo”.

Ele diz que “essa inteligência composicional permite que o enxame forneça resultados de ponta a ponta, abrangendo documentos, sites, slides e planilhas em uma única execução autônoma”.

O modelo Kimi K2.6 agora oferece suporte a agentes autônomos operando continuamente em aplicativos e fluxos de trabalho. Esta versão também melhora a interpretação da API, a estabilidade de longa duração e a conscientização sobre segurança.

A empresa demonstrou um agente apoiado pelo K2.6 que “operou de forma autônoma por 5 dias, gerenciando monitoramento, resposta a incidentes e operações do sistema, demonstrando contexto persistente, manipulação de tarefas multithread e execução de ciclo completo, do alerta à resolução”.

Também: Agentes de IA são rápidos, soltos e fora de controle, segundo estudo do MIT

Outro recurso adicionado ao Kimi K2.6 é o que a empresa chama de “Grupos de Garra”, permitindo que vários agentes do estilo OpenClaw executados em dispositivos colaborem com um contexto compartilhado. Existe um coordenador central que atribui tarefas de forma dinâmica e resolve falhas.

Moonshot AI diz que tudo isso se torna uma forma de inteligência coletiva. Diz: “Estamos indo além de simplesmente fazer uma pergunta à IA ou atribuir uma tarefa à IA, e entrando em uma fase em que humanos e IA colaboram como parceiros genuínos – combinando forças para resolver problemas coletivamente”.

Contanto que os agentes não inventem a viagem no tempo, provavelmente estaremos seguros. Por agora.

Você se sentiria confortável em deixar um agente de IA funcionar continuamente por dias, gerenciando sistemas em seu nome? Deixe-nos saber nos comentários abaixo.


Você pode acompanhar as atualizações diárias do meu projeto nas redes sociais. Certifique-se de se inscrever meu boletim informativo semanal de atualizaçãoe siga-me no Twitter/X em @DavidGewirtzno Facebook em Facebook.com/DavidGewirtzno Instagram em Instagram.com/DavidGewirtzno Bluesky em @DavidGewirtz.come no YouTube em YouTube.com/DavidGewirtzTV.



fonte