Início Tecnologia I Vibe codificado com Claude, ChatGPT e Gemini. O segredo é um...

I Vibe codificado com Claude, ChatGPT e Gemini. O segredo é um alerta assassino

27
0

Codificação de vibração é algo que qualquer um pode aprender, desde que você saiba digitar ou falar. Não garante um resultado perfeito, mas não requer nenhum conhecimento alquímico – apenas paciência.

Basta falar com o seu Bot de bate-papo com IA com instruções sobre o que você deseja criar e chegará à codificação. Em seguida, teste-o e continue iterando até ficar satisfeito com seu projeto. Essa é a codificação vibratória da forma mais simples.

Atlas de IA

Eu brinquei bastante com vibe coding, criando projetos aleatórios aqui e ali. Eu tentei principalmente para prova de conceito ou testes de chatbot, mas raramente para fazer algo crucial ou funcional o suficiente para usar diariamente.

Então comecei a procurar um dispositivo de leitura eletrônica e saí frustrado com o quão incrivelmente “burros” a maioria deles é, especialmente os Kindles. Mais sobre isso mais tarde.

Independentemente da motivação (mas principalmente em desafio à Amazon), isso me levou a tentar criar uma solução para o código, mas com uma reviravolta. Eu queria ver se conseguia codificar um aplicativo de leitura eletrônica funcional com todos os recursos que eu queria. Sabendo que mesmo que eu colocasse essa coisa em funcionamento, provavelmente não a usaria diariamente, mas queria adicionar um toque especial.

A questão passou a ser qual chatbot de IA usar. Testei três – Gemini, Claude e ChatGPT – para criar o que queria e depois ver qual produzia melhores resultados.

A solicitação

Comparar chatbots é difícil, especialmente quando se tenta imitar a mesma conversa ou vibração em um projeto de codificação. Acredite em mim, eu tentei. Eu queria ter certeza de que todas as ferramentas que testei usavam o mesmo prompt, mas primeiro queria refiná-lo para obter os melhores resultados, então criei uma estratégia para me ajudar a fazer isso.

Primeiro, construí todo o projeto do zero com o Gemini. Assim que gostei de onde estava o projeto (uma prova de conceito funcional e bem-sucedida), pedi para criar um prompt para que eu pudesse adicioná-lo a qualquer outro chatbot. Gemini gerou o prompt, salvei-o como um arquivo e carreguei-o para Claude. Passei por esse processo novamente, permitindo que Claude detectasse e consertasse coisas que eu não havia pensado ao construir o projeto e o Gemini. Assim que o processo foi concluído, pedi para criar outro prompt para que eu pudesse adicioná-lo ao ChatGPT.

A ideia era fazer com que todos os três chatbots contribuíssem para a própria criação do projeto e, por sua vez, para o prompt final. Depois que o prompt foi criado, carreguei-o em todos os três chatbots em um bate-papo separado para ver a consistência do desempenho deles.

O projeto: O Leitor de Tomos

Eu queria criar um aplicativo web de e-reader imersivo que pudesse ler seus livros em voz alta (com destaque de texto em tempo real), quer você colasse texto ou carregasse um arquivo PDF ou EPUB.

Este projeto nasceu da minha frustração com os dispositivos Kindle da Amazon. Qualquer pessoa que goste de ler e ouvir seus livros pode fazê-lo com destaque em tempo real no aplicativo para iOS ou Android, mas depois de todo esse tempo – quase 20 anos – você não pode fazer isso em um Kindle.

Na verdade, não faz muito tempo que os usuários ganharam a capacidade de realçar texto em tempo real com a reprodução assistida do leitor, que está tão próxima da funcionalidade do aplicativo. A partir de agora, você só pode ler ou ouvir um audiolivro no Kindle, não em ambos, o que é ridículo, assim como a ideia de a Amazon possuir todos os meus livros. Comecei a pensar que poderia simplesmente codificar uma solução.

Eu o chamo de Leitor de Tomos.

Além de ler o texto em voz alta, o aplicativo da web criaria música de fundo dependendo do conteúdo do texto em um subconjunto de categorias (neutro, terror gótico, ficção científica, natureza, fantasia, subaquático, faroeste, mistério) e geraria efeitos sonoros e visuais adicionais quando certas palavras-gatilho fossem faladas em tempo real. Todo o projeto foi criado em um único arquivo HTML para que pudesse ser executado em um navegador web sem dependências adicionais.

Construindo com chatbots: a primeira rodada


Gêmeos

Projeto Vibe Coding - Tome Reader - Gemini

Gemini criou todos os recursos que eu queria do Tomb Reader com relativa facilidade.

Google/Captura de tela de Blake Stimac

Gemini me permitiu descobrir até onde eu poderia ampliar a funcionalidade desse aplicativo da web e, portanto, a maior parte dela vem do chatbot do Google. Isso me permitiu resolver alguns pequenos problemas no início, o que impediu o carregamento das vozes do TTS. Em vez disso, criou uma tela de inicialização que forçaria o carregamento das vozes após clicar em uma tela “aberta” do aplicativo. Sem esse tipo de conhecimento o projeto não teria saído do papel.

Lenta mas seguramente, a funcionalidade do projeto começou a crescer. Como os efeitos sonoros ao vivo para certas palavras podem distrair, adicionei uma opção para desligá-los, junto com a música de fundo. Depois de colocar a base do aplicativo funcionando, pedi ao Gemini para criar um prompt que eu pudesse compartilhar com outros chatbots para que pudesse construí-lo em outro lugar, se quisesse, e foi isso que ele fez.


Cláudio

Projeto Vibe Coding - Tome Reader - Claude

O projeto de Claude me deu mais sucesso em algumas áreas e mais problemas em outras, mas é o meu favorito dos três projetos de teste.

Antrópico/Captura de tela de Blake Stimac

Claude fez refinamentos fantásticos na função subjacente das palavras-gatilho neste projeto. Claude expandiu o vocabulário e melhorou a visualização quando uma palavra-gatilho foi pronunciada em voz alta. Dito isso, Claude fez uma ligação que eu não pedi, embora a lógica realmente fizesse sentido.
Inicialmente, pensei que o projeto não estava funcionando porque quando testei sua funcionalidade, apenas a primeira palavra-gatilho produziria o efeito desejado em uma sequência de quase 10. Demorou algum tempo para Claude finalmente revelar que havia decidido permitir que os efeitos sonoros e visuais fossem acionados apenas uma vez por frase, para não “enviar spam” ao usuário. Isso fazia muito sentido, mas o projeto era mais uma prova de conceito do que um leitor funcional, e Gemini e ChatGPT geravam efeitos sonoros para cada palavra-chave, que era a funcionalidade esperada.

Dito isso, não havia nenhuma instrução específica no prompt sobre quantas vezes os efeitos sonoros e visuais foram reproduzidos. Embora não fosse necessariamente o que eu queria, apreciei a consideração da experiência geral do usuário ao fazer esta ligação. Então, depois que todos esses refinamentos foram codificados, Claude atualizou o prompt e eu o levei para o ChatGPT.


Bate-papoGPT

Projeto de codificação Vibe - Tome Reader - ChatGPT

Às vezes, o ChatGPT não conseguiu criar recursos adicionais quando solicitei, mas ainda assim conseguiu recriar o projeto perfeitamente quando lhe dei a solicitação final.

OpenAI/Captura de tela de Blake Stimac

No momento em que criei o prompt atualizado com Claude, não havia muito mais que eu pudesse pensar em fazer quando o carreguei no ChatGPT. Felizmente, o chatbot da OpenAI criou o projeto com facilidade, embora fosse o mais lento na geração de código. A única função que pedi ao ChatGPT para adicionar ao projeto – criar um controle deslizante de volume dedicado para a música de fundo para que pudesse ser completamente desligado se alguém quisesse apenas uma experiência de leitura eletrônica dedicada – falhou consistentemente. Eventualmente, voltei para Claude para solicitar essa funcionalidade e recriar o prompt.


Rodada 2: Recriando o mesmo projeto

Apesar de usar o Gemini 3 Pro para construir inicialmente o projeto e as versões gratuitas do ChatGPT e Claude, os três criaram o projeto, mas não sem problemas.

Passei a maior parte do tempo com Claude refinando o projeto, e ele foi o responsável pela criação da versão final. Portanto, foi incrivelmente surpreendente descobrir que, ao enviar esse prompt para um novo chat, o projeto não carregava além da primeira página de “inicialização”. Apesar de não ter nenhum problema com as iterações anteriores, foram necessárias 11 (sim, realmente) reconstruções completas adicionais para descobrir o que estava acontecendo.

Recriar o projeto com Gemini e ChatGPT funcionou perfeitamente. Todas as funções, básicas e avançadas, funcionaram como deveriam, incluindo upload de arquivos, destaque de teste, saída de texto para fala e efeitos de áudio e visuais quando palavras-gatilho foram faladas em voz alta. Voltando aos modelos, vi muito pouca diferença na função ou no desempenho ao dar o mesmo prompt para cada chatbot.

Peculiaridades do chatbot

Adquirir o arquivo de teste sempre foi fácil com Claude. Ele não apenas oferecia uma prévia do projeto para que você nunca precisasse baixar o arquivo HTML, mas se quisesse (o que eu fazia com frequência para testes), ele estava disponível para download diretamente. Essa opção às vezes era oferecida com ChatGPT, enquanto outras vezes eu só conseguia copiar o HTML e salvá-lo sozinho.

Apesar de ter o menor número de erros e dúvidas gerais com Gêmeos, sempre foi necessário que você percorresse o caminho mais longo e fizesse dessa maneira. Deixando tudo isso de lado, o fato de o ChatGPT às vezes me oferecer para baixar o arquivo diretamente como HTML era peculiar e um pouco frustrante.

O vencedor depende

Definir um vencedor para este tipo de teste é complicado, pois todos os chatbots têm prós e contras. De certa forma, todos eles ganham. Cada um deles conseguiu criar uma versão funcional do projeto em algum momento, mas muitas vezes foram necessários esforços repetidos.

Em última análise, o vencedor é o usuário. Isso mostra que, independentemente do modelo utilizado, um conjunto sólido de instruções pode levar você longe. Não consegui distinguir diferenças de desempenho ou função entre o aplicativo criado pelo Gemini 3 Pro e as versões gratuitas do ChatGPT ou Claude.

Na verdade, isso vai diretamente contra o que descobri ao ter uma conversa semelhante com os modelos Gemini pro e free. Embora tenha sido outro dia, outro projeto e outro modelo, isso mostra que um prompt sólido pode levar você incrivelmente longe no mundo da codificação de vibração.



fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui