Início Tecnologia Esta nova ferramenta Claude Code Review usa agentes de IA para verificar...

Tecnologia

Esta nova ferramenta Claude Code Review usa agentes de IA para verificar se há bugs em suas solicitações pull – veja como

Por

Wagner Costa

9 Março 2026

Antrópico / Elyse Betters Picaro / ZDNET

Siga ZDNET: Adicione-nos como fonte preferencial no Google.

Principais conclusões da ZDNET

Anthropic lança agentes de IA para revisar solicitações pull de desenvolvedores.
Os testes internos triplicaram o feedback significativo da revisão de código.
Revisões automatizadas podem detectar bugs críticos que os humanos não percebem.

A Anthropic anunciou hoje um novo recurso beta de Code Review integrado ao Claude Code para usuários dos planos Teams e Enterprise. É uma nova ferramenta de software que usa agentes trabalhando em equipes para analisar blocos completos de novo código em busca de bugs e outros problemas potencialmente problemáticos.

O que é uma solicitação pull?

Para entender essa nova oferta da Anthropic, você precisa entender o conceito de pull request. E que me leva a uma história sobre um homem chamado Linus.

Há muito tempo, o criador do Linux, Linus Torvalds, teve um problema. Ele gerenciava muitas contribuições para o sistema operacional Linux de código aberto. Todas as mudanças estavam ficando fora de controle. Os sistemas de controle de código-fonte (um método para gerenciar alterações no código-fonte) já existiam há algum tempo, mas tinham um grande problema. Esses antigos SCCSs não foram feitos para gerenciar o desenvolvimento distribuído por codificadores em todo o mundo.

Também: Usei Claude Code para codificar um aplicativo Mac em 8 horas, mas deu mais trabalho do que mágica

Então, Linus inventou o Git. Se você é um programador, você conhece o Git. É o mecanismo de coordenação subjacente para alterações de código. E se você pensava que Linus era um deus da codificação apenas para Linux, a criação do Git e seus descendentes, especialmente o GitHub, deveria colocá-lo no topo do Monte Olimpo. O cara criou não apenas uma, mas duas tecnologias que mudam o mundo.

Hoje, quase todos os grandes projetos usam GitHub ou um de seus concorrentes. GitHub (diferenciado do Git) é o serviço de nuvem centralizado que contém repositórios de código gerenciados pelo Git. Há alguns anos, o GitHub foi comprado pela Microsoft, fomentando todos os tipos de teorias de conspiração pessimistas. Mas a Microsoft provou ser uma boa administradora desse recurso precioso, e o GitHub continua trabalhando, gerenciando o código do mundo.

Tudo isso nos traz de volta às solicitações pull, conhecidas como PRs na linguagem do codificador. Uma solicitação pull é iniciada quando um programador deseja fazer check-in de algum código novo ou alterado em um repositório de código. Em vez de apenas fundi-lo na linha principal, um PR informa aos supervisores do repo que há algo novo, pronto para ser revisado.

Também: Tentei economizar US$ 1.200 com vibe coding de graça – e rapidamente me arrependi

Nota rápida: para codificadores, PR é um acrônimo para pull request. Para os profissionais de marketing, RP significa relações públicas. Ao ler sobre tecnologia, você verá as duas siglas, então preste atenção ao contexto para distinguir entre as duas.

Às vezes, o código é verificado com muito cuidado antes de ser mesclado na base de código principal. Mas outras vezes, ele simplesmente é carimbado e mesclado. As revisões de código, embora necessárias, também são tediosas e demoradas.

É claro que o custo de carimbar um PR pode ser catastrófico. Você pode enviar código com bugs, perder dados ou danificar os sistemas do usuário. Na melhor das hipóteses, o código com erros é simplesmente irritante. Na pior das hipóteses, pode causar danos catastróficos.

É aí que entra o novo Claude Code Review da Anthropic.

Revisão de código na Anthropic

Em meu artigo, 7 técnicas de codificação de IA que uso para enviar produtos reais e confiáveis - rápido, minha técnica bônus foi usar IA para revisão de código. Como desenvolvedor solitário, não uso um processo formalizado de revisão de código como o que a Anthropic está introduzindo.

Acabei de dizer a uma nova sessão da IA para examinar meu código e me informar o que não está certo. Às vezes eu uso a mesma IA (ou seja, Claude Code para analisar o código de Claude) e outras vezes eu uso uma IA diferente (como quando uso o Codex da OpenAI para revisar o código gerado por Claude Code). Está longe de ser uma revisão abrangente, mas quase sempre que peço uma revisão, uma IA ou outra encontra algo que precisa ser consertado.

O novo recurso Claude Code Review é modelado no processo usado pela Anthropic. A empresa produziu essencialmente uma metodologia interna própria. De acordo com a Anthropic, os clientes “Diga-nos que os desenvolvedores estão sobrecarregados e que muitos PRs obtêm leituras rápidas em vez de leituras profundas”.

Também: Como mudar de ChatGPT para Claude: transferir suas memórias e configurações é fácil

Esta nova IA de revisão de código de agência é capaz de fornecer uma cobertura de revisão automatizada mais profunda antes de precisar de decisões humanas.

A Anthropic afirma que a produção de código por engenheiro da Anthropic aumentou 200% no ano passado, intensificando a pressão sobre os revisores humanos. Você acha? A empresa tem usado sua própria IA para escrever código, o que acelera a produção de código, de modo que as mudanças e novos blocos de código estão chegando mais rápido do que nunca.

A Anthropic relata que o novo sistema Code Review é executado internamente em quase todas as solicitações pull. Quando um PR é revisado, os revisores humanos geralmente fazem comentários sobre os problemas que veem, que o codificador precisa voltar e corrigir.

Antes de executar o Code Review, os codificadores da Anthropic recebiam comentários de revisão “substantivos” cerca de 16% das vezes. Com o Code Review, os programadores recebem comentários substanciais 54% das vezes. Embora isso pareça significar mais trabalho para os programadores, o que realmente significa é que quase três vezes o número de erros de codificação foram detectados antes de causarem danos.

Também: Usei o Claude Code para codificar um aplicativo Apple Watch em apenas 12 horas – em vez de 2 meses

De acordo com a Anthropic, o tamanho do PR interno impacta o nível dos resultados da revisão. Grandes solicitações pull com mais de 1.000 linhas alteradas mostram descobertas em 84% das vezes. Pequenas solicitações pull com menos de 50 linhas produzem descobertas 31% das vezes. Os engenheiros antrópicos “concordam amplamente com o que surge: menos de 1% das descobertas são marcadas como incorretas”.

Caramba, quando eu codifico, mesmo se eu adicionar apenas uma linha de código, há uma chance de introduzir um bug. Testes e revisões de código são essenciais se você não quiser que milhares de usuários venham até você brandindo forcados e tochas virtuais. Não me pergunte como eu sei.

Exemplos de problemas surgidos durante os testes

Sempre fico fascinado com o que os outros vivenciam enquanto fazem seu trabalho. A Anthropic forneceu alguns exemplos de problemas que o Code Review identificou durante seus primeiros testes.

Num caso, uma mudança de linha única parecia ser rotina. Normalmente teria sido aprovado rapidamente. Mas o Code Review sinalizou isso como crítico. Acontece que essa pequena mudança teria quebrado a autenticação do serviço. Como o Code Review detectou isso, ele foi corrigido antes da mudança. O codificador original disse que não teria detectado esse erro sozinho.

Também: Experimentei um rival do Claude Code que é local, de código aberto e totalmente gratuito – como foi

Outro exemplo ocorreu quando o código de criptografia do sistema de arquivos estava sendo reorganizado em um produto de código aberto. De acordo com o relatório, “a revisão do código revelou um bug pré-existente no código adjacente: uma incompatibilidade de tipo que limpava silenciosamente o cache da chave de criptografia em cada sincronização”.

Isso é o que chamamos de assassino silencioso na codificação. Isso poderia ter resultado em perda de dados, degradação de desempenho e riscos de segurança. A Anthropic descreveu isso como “Um problema latente no código que o PR tocou, o tipo de coisa que um revisor humano examinando o conjunto de alterações não procuraria imediatamente.”

Se isso não tivesse sido detectado e corrigido, teria sido um dia muito ruim para alguém (ou para um monte de gente).

Como funciona o sistema de revisão multiagente

A revisão de código é executada com bastante rapidez, resolvendo revisões bastante complexas em cerca de 20 minutos. Quando uma solicitação pull é aberta, o Code Review inicia vários agentes que analisam o código em paralelo.

Vários agentes detectam possíveis bugs, verificam as descobertas para filtrar falsos positivos e classificam os problemas por gravidade. Os resultados são consolidados para que todos os resultados de todos os agentes apareçam como um único comentário resumido na solicitação pull, juntamente com comentários embutidos para problemas específicos.

Também: Como instalar e configurar o Claude Code, passo a passo

Em uma demonstração, a Anthropic mostrou que o comentário resumido também pode incluir uma diretiva de correção. Portanto, se o Code Review encontrar um bug, ele poderá ser enviado ao Claude Code para correção. A empresa afirma que as revisões aumentam com a complexidade: solicitações pull maiores recebem análises mais profundas e mais agentes.

A Antrópica realmente parece gostar de gerar vários agentes. No passado, tive sérias dificuldades em discuti-los depois de serem lançados. Na verdade, a primeira técnica que compartilhei em meu artigo sobre 7 técnicas de codificação foi dizer especificamente a Claude Code para evitar o lançamento de agentes em paralelo.

Existem alguns recursos internos de gerenciamento de tarefas no Claude (o comando /tasks, por exemplo), mas eu preferiria ver um painel de gerenciamento de tarefas mais abrangente antes de confiar nos resultados de dezenas de agentes gerados.

Modelo de custos e controles administrativos

As avaliações são cobradas com base no uso do token. O preço varia de acordo com o tamanho e a complexidade da solicitação pull que está sendo analisada, mas a empresa diz que uma revisão de código normalmente custa entre US$ 15 e US$ 25. De certa forma, isso pode ficar muito caro muito rapidamente.

Uma das Substacks relacionadas à engenharia mais populares é The Pragmatic Engineer. Em um artigoGergely Orosz diz que cada engenheiro da Antrópico normalmente produz cerca de cinco PRs por dia. Na prática, os desenvolvedores típicos que não usam suporte de codificação de IA produzem no máximo um ou dois por semana.

Também: Quer codificação de vibração local? Esta pilha de IA pode substituir Claude Code e Codex – de graça

Como um cálculo rápido, digamos que uma empresa tenha cem desenvolvedores, cada um produzindo um PR por dia, cinco dias por semana. Em nosso exemplo de fantasia, os engenheiros de software têm folga nos fins de semana. Isso levaria a 500 PRs por semana, ou 2.000 por mês. A uma média de US$ 20 por PR, essa quantidade de PRs de revisão de código poderia custar a esta empresa de exemplo cerca de US$ 40.000 por mês, ou US$ 480.000 por ano.

Isso pode parecer muito. Mas então considere o custo de um bug catastrófico que vaza para os clientes e quanto isso pode custar em dólares reais e no valor da reputação da marca para consertar, e isso começa a parecer acessível.

Está claro que a Anthropic encontrou um novo centro de lucro. Mesmo nesse nível de despesas, provavelmente vale a pena que as empresas empreguem ativamente a Revisão de Código.

A empresa afirma que existem maneiras de controlar gastos e uso, incluindo:

Limites mensais da organização: defina o gasto mensal total em todas as avaliações.
Controle em nível de repositório: ative revisões apenas nos repositórios que você escolher.
Painel de análise: Rastreie PRs revisados, taxa de aceitação e custos totais de revisão.

Verificação automática

Os administradores com planos Team e Enterprise podem ativar o Code Review por meio das configurações do Claude Code e da instalação do aplicativo GitHub. Depois de ativadas, as revisões são executadas automaticamente em novas solicitações pull sem configuração adicional do desenvolvedor. É por isso que os limites de uso e o controle em nível de repositório se tornam muito importantes para o gerenciamento de custos.

E você?

Você já está usando ferramentas de IA para revisar seu código ou receber solicitações? Você confiaria em um sistema multiagente automatizado para sinalizar bugs e problemas de segurança antes que humanos vissem o código? Você acha que pagar US$ 15 a US$ 25 por solicitação pull para revisão automatizada faz sentido ou os custos aumentariam muito rapidamente?

Também: Claude Code ganhou surpreendentes US$ 1 bilhão em 6 meses – e meu próprio aplicativo para iPhone com código de IA mostra por quê

Se você é um desenvolvedor, os revisores de código de IA já detectaram problemas que você pode ter perdido? Como eu disse, estou usando apenas prompts básicos para gerar revisões de código, mas isso certamente me ajudou a produzir um código melhor.

E você? Deixe-nos saber nos comentários abaixo.

Você pode acompanhar as atualizações diárias do meu projeto nas redes sociais. Certifique-se de se inscrever meu boletim informativo semanal de atualizaçãoe siga-me no Twitter/X em @DavidGewirtzno Facebook em Facebook.com/DavidGewirtzno Instagram em Instagram.com/DavidGewirtzno Bluesky em @DavidGewirtz.come no YouTube em YouTube.com/DavidGewirtzTV.

fonte

Esta nova ferramenta Claude Code Review usa agentes de IA para verificar se há bugs em suas solicitações pull – veja como

Principais conclusões da ZDNET

O que é uma solicitação pull?

Revisão de código na Anthropic

Exemplos de problemas surgidos durante os testes

Como funciona o sistema de revisão multiagente

Modelo de custos e controles administrativos

Verificação automática

E você?

DEIXE UMA RESPOSTA Cancelar resposta

Recente

Dicas, respostas e ajuda do NYT Strands de hoje para 10...

A canadense Deane Leonard recebe o prêmio Ed Block Courage pelo...

Como tornar seu produto de comércio eletrônico visível para agentes de...

Dicas, respostas e ajuda do NYT Connections de hoje para 10...

CH: Você está disponível para duas trocas?

O novo recurso de segurança da Samsung reinicia seu telefone após...

Táxis aéreos elétricos estão prestes a decolar em 26 estados

À TVA Sports: um jogo que os Flyers não podem deixar...

Dicas, respostas e ajuda do Wordle de hoje para 10 de...

As classificações do piloto de ‘The Fall and Rise of Reggie...