Início Tecnologia Tentei codificar o mesmo projeto com o Vibe usando diferentes modelos Gemini....

Tentei codificar o mesmo projeto com o Vibe usando diferentes modelos Gemini. Os resultados foram dramáticos

17
0

Codificação de vibração é muito divertido quando você conhece a essência geral do processo. É tão fácil quanto conversar com um Bot de bate-papo com IA e fazer com que ele codifique um aplicativo para você, mas requer tempo e paciência para resolver os problemas. Eu criei vários projetos de codificação vibemas sempre há novas maneiras de testar a qualidade desses resultados, especialmente quando você considera o modelo que está usando.

Com tantos modelos de IA para mexer, eles podem produzir resultados significativamente diferentes, especialmente se você não tiver um plano sólido em mente. Eu queria ver como os modelos mais leves se comparam aos modelos “pensantes”, como o Google e a OpenAI se referem a eles. Esses modelos mais leves variam em nome: a interface Gemini do Google o chama de Fast (embora o modelo seja chamado, por exemplo, Gemini 2.5 Flash), enquanto a OpenAI o chama de Instant.

Atlas de IA

Resolvi realizar um experimento utilizando dois modelos para criar o mesmo projeto. Primeiro, criei um projeto do começo ao fim usando o Gemini 3 Pro do Google e queria replicá-lo usando um de seus modelos mais leves, tentando manter a mesma conversa. Na época, o mais recente dos modelos leves era o Gemini 2.5 Flash. Os resultados foram reveladores: ambos criaram tecnicamente o mesmo resultado, mas a jornada para chegar lá foi muito diferente entre os dois.

Eu estava com falta de inspiração para esse experimento, então simplesmente o entreguei ao Gemini. Pedi que ele apresentasse projetos interessantes de codificação de vibração que eu pudesse executar e optei por um chamado “Trophy Display Case”. Pedi ao Gemini que exibisse uma lista de filmes de terror, em vez de troféus, e fornecesse mais informações sobre eles quando clicasse em um dos pôsteres. Fora desses requisitos, dei controle criativo a ambos os modelos Gemini.

Modelos de IA rápidos versus pensantes: Qual é a diferença?

Se o Google nos dá a escolha entre os modelos Flash e Pro, eles devem ser substancialmente diferentes, certo? Sim e não. Ambos são grandes modelos de linguagem, mas operam de maneira diferente. Para o usuário comum, “rápido” e “pensamento” definem bem as diferenças entre os dois: velocidade versus profundidade.

UM modelo de raciocínio é um LLM que foi ajustado para dividir problemas complexos em etapas menores antes de gerar o resultado final. Isso é feito executando um caminho de raciocínio de cadeia interna de pensamento. Tanto o Gemini 2.5 Flash quanto o Gemini 3 Pro são modelos racionais, mas o Gemini 2.5 Flash leva um abordagem híbrida: Oferece um ato de equilíbrio entre velocidade e raciocínio.

Gemini 3 Pro é o modelo de raciocínio mais forte e é otimizado para mergulhar fundo em busca de respostas. Como resultado, é mais lento que modelos mais eficientes como o 2.5 Flash. Desde então, o Google lançou Gêmeos 3 Flashum modelo básico mais poderoso que substituiu o Flash 2,5. O Gemini 3 Pro continua sendo o modelo de raciocínio mais poderoso disponível no Gemini para a maioria das pessoas.

O modelo Gemini 3 Pro fez a maior parte do trabalho

Projeto de filme de codificação Gemini 3 Pro Vibe

O projeto final que o Gemini 3 Pro fez não foi perfeito, mas foi melhor do que minha ideia original e cerca de um quilômetro à frente do que o Gemini 2.5 Flash produziu.

Google Gemini/Captura de tela de Blake Stimac/CNET

Usando o Gemini 3 Pro, consegui criar uma landing page que exibia os filmes da minha lista, completa com imagens de pôster, e quando você clicava em um título, uma página se abria e revelava informações adicionais, junto com um link para visualizar o trailer no YouTube. Não foi um projeto complicado, mas encontrei muitos problemas e erros ao longo do caminho.

Originalmente, eu queria que os trailers fossem incorporados à página, mas ele continuava sinalizando erros que o Gemini não conseguia corrigir, então resultou em uma redução, apenas fornecendo uma imagem vinculada para assistir ao trailer no YouTube. Foi bom, mas uma experiência menos perfeita do que eu queria. Dito isso, gostei de como o Gemini 3 Pro detalhou os problemas específicos que estava enfrentando com esse recurso e me permitiu tomar a decisão de descartá-lo.

Outro problema que o Gemini 3 Pro tentou corrigir várias vezes foi o que descreveu como um problema de camadas. Ao clicar em um pôster, um pop-up com os detalhes do filme seria exibido, junto com um pequeno botão para sair dessa visualização, embora nunca tenha funcionado. Pedi ao Gemini para consertar isso quatro vezes e ele não resolveu o problema até a última solicitação. Gemini explicou o que estava fazendo com o código em linhas gerais, mas nunca entrou em muitos detalhes, embora eu imaginasse que ele teria fornecido detalhes se eu perguntasse.

O projeto original era simplesmente uma forma de exibir uma coleção de filmes e obter mais informações sobre eles. Fora isso, não pensei em estilo ou maneiras de tornar o aplicativo da web interessante, e o Gemini 3 Pro foi útil nessa área. Quando perguntei como poderia melhorar o aplicativo, tanto em design quanto em recursos, ele sugeriu adicionar um efeito de roda 3D aos filmes e uma opção de escolha aleatória.

Este projeto levou quase 20 iterações. O produto final era o melhor possível e era um projeto divertido, mas havia problemas que o Gemini não conseguia resolver com mais frequência. O produto final fez mais do que eu esperava, então fiquei feliz com ele. Mas com todos os problemas que encontrei, comecei a me perguntar como o rápido modelo Gemini lidaria com o mesmo projeto.

A codificação Vibe com Gemini 2.5 Flash é mais manual

Não é novidade que usar o modelo “rápido” foi mais rápido que o Gemini 3 Pro, mas na maioria das vezes esse modelo sugeria abordagens mais manuais para encontrar soluções para o projeto. A IA funcionou rapidamente, mas criou mais trabalho – e mais lento – para mim.

Por exemplo, eu queria que o aplicativo web mostrasse o pôster e a sinopse de cada filme da lista, mas nunca pensei em como essa informação seria gerada. Sem perguntar especificamente, o Gemini 3 Pro sugeriu que eu pudesse me inscrever no O banco de dados de filmes e obter uma chave de API para obter esses detalhes automaticamente, onde o Gemini 2.5 Flash basicamente me disse para “adquirir” as imagens e partir daí. Como adquiri essas imagens aparentemente dependia de mim.

O Gemini 2.5 Flash às vezes parece quase preguiçoso em comparação com o Gemini 3 Pro. Há algumas coisas que o modelo Gemini Pro fará sem ser solicitado, mas o Flash precisa de instruções mais específicas. Às vezes, parecia que eu estava estimulando uma criança que ouvia as instruções, mas evitava intencionalmente suas tarefas.

Em vários casos, depois que solicitei ao Gemini 2.5 Flash para fazer uma alteração, ele o fez e forneceu o código atualizado, mas apenas para a seção específica que havia modificado. Então, ele me instruiria a trocar o código antigo pelo novo. Se você sabe o que está procurando, substituir uma seção de código por outra provavelmente não é grande coisa, mas isso é vibração de codificação, e se você não sabe onde colocar o código, mesmo que seja realmente uma tarefa fácil, isso pode parar algumas pessoas. Isso pode atrapalhar a vibração.

Além disso, o Gemini 2.5 Flash simplesmente sugeriu que eu “adquirisse” as imagens do pôster do filme e detalhes adicionais. Então, ao quebrar os limites dos parâmetros do experimento para usar apenas os mesmos prompts em ambos os projetos (que eram soltos, na melhor das hipóteses), decidi perguntar ao Gemini 2.5 Flash o que ele achou da ideia de adicionar a chave de API para o The Movies Database. Ele acolheu a ideia e me disse onde adicionar a chave. Em vez disso, pedi ao modelo para adicionar a chave que forneci. Ele adicionou a chave, mas quando executei o aplicativo da web, ele não estava extraindo imagens de pôster dos filmes que listei, então tive que pedir para corrigir isso novamente. O modelo aludiu às suas limitações dizendo: “Encontrar o ID exato do TMDB para cada filme em sua lista original é demorado, mas preencherei a matriz com tantos IDs confirmados quanto possível para tornar a coleção precisa de sua lista solicitada”.

Se fez alguma coisa que disse que faria, eu não percebi. Em comparação com a grande variedade de filmes diferentes que surgiram, qualquer correspondência da lista que forneci parecia uma coincidência. Ainda assim, embora 99% dos pôsteres de filmes preenchidos estivessem incorretos, isso ainda me impediu de adicionar manualmente as próprias imagens, em teoria. Em contraste, o Gemini 3 Pro preencheu todos os pôsteres de filmes corretos de uma só vez.

Como os modelos rápidos e pensantes diferiam na codificação de vibração

Cada vez que eu pedia um ajuste ao modelo de pensamento do Gemini, ele fazia a alteração e imediatamente reescrevia todo o código para que eu pudesse simplesmente copiar e colar o código inteiro onde quisesse, sem precisar saber onde o código foi atualizado.

O Gemini 2.5 Flash era diferente. A certa altura, depois de fazer um pequeno ajuste, ele me deu o código e me disse para substituí-lo pelo que estava lá. Na esperança de evitar isso, pedi para reescrever o código completo para não precisar alterar nada. Sua resposta: “Essa é uma grande pergunta”. Embora parecesse acreditar que eu estava pedindo muito mais naquele momento, é um pouco chocante quando comparado ao Gemini 3 Pro.

Os projetos

Projeto de filme de codificação Gemini 2.5 Flash Vibe

Gemini 2.5 Flash fez um projeto um tanto viável, mas estava repleto de erros mesmo depois de tentar corrigi-los.

Google Gemini/Captura de tela de Blake Stimac/CNET

No final dos meus testes, nenhum dos modelos era perfeito, mas trabalhar com o Gemini 3 Pro foi significativamente mais fácil. Embora ambos os modelos possam, num outro projeto, produzir resultados muito semelhantes, chegar a esse destino final provavelmente seguirá dois caminhos muito diferentes.

Trabalhando com o Gemini 2.5 Flash, você precisa ser específico sobre o que deseja que ele faça e estar pronto para corrigi-lo quando parecer que são necessários atalhos. Será necessária prática e experiência, inclusive trabalhar com outros modelos de IA, para detectar quando o modelo está tomando um atalho que pode afetar o projeto. Se este for o único modelo com o qual você está trabalhando, você precisará ser mais diligente com ele em geral.

Gemini 3 Pro realmente merece esse nome. Ele não apenas cuidou do trabalho pesado deste projeto, mas também ofereceu sugestões úteis que o elevaram da ideia básica com a qual comecei.



fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui