Início Tecnologia Experimentei o ChatGPT Images 2.0: um salto enorme e divertido – e...

Experimentei o ChatGPT Images 2.0: um salto enorme e divertido – e surpreendentemente útil para trabalho real

22
0

David Gewirtz/Elyse Betters Picaro/ZDNET

Siga ZDNET: Adicione-nos como fonte preferencial no Google.


Principais conclusões da ZDNET

  • O Images 2.0 oferece texto preciso e gráficos utilizáveis.
  • Pode combinar estilos de marca, incluindo visuais ZDNET.
  • Erros ainda ocorrem, exigindo revisão humana.

No início desta semana, a OpenAI revelou o ChatGPT Images 2.0, seu novo mecanismo de geração de imagens. A chave para este lançamento é um salto na funcionalidade, desde a criação de “decorações” (termo da OpenAI) até gráficos de página inteira, incluindo texto detalhado.

Tive acesso antecipado a uma versão de pré-lançamento. Funcionou muito bem, mas continuou atrapalhando o logotipo da ZDNET. Agora que o produto foi lançado oficialmente, estou realizando um teste aprofundado em uma ampla gama de desafios.

O Images 2.0 está disponível para todos os níveis ChatGPT, mas os recursos de linguagem mais capazes estão disponíveis apenas para níveis pagantes que podem usar o modelo Thinking. Estou executando todos esses testes usando uma conta ChatGPT Plus com o Thinking ativado.

Além disso: coloquei o GPT-5.5 em um teste de 10 rodadas: ele marcou 93/100, perdendo pontos apenas pela exuberância

Vamos começar com os exercícios de branding ZDNET. Em vez de apenas fazer upload de páginas ZDNET e encontrar o logotipo na página, criei uma imagem independente do logotipo ZDNET e carreguei-a com cada prompt. Isso pareceu ajudar tremendamente.

[One quick note: ZDNET doesn’t permit OpenAI to scrape its pages. Ziff Davis, ZDNET’s parent company, filed an April 2025 lawsuit against OpenAI, alleging it infringed Ziff Davis copyrights in training and operating its AI systems. So I used a Chrome extension to capture full-screen screenshots of the articles I wanted to test with Images 2.0. That’s how ChatGPT was able to read them.]

O Images 2.0 pode preservar o logotipo ZDNET?

Meu ponto de partida foi o artigo que escrevi anteriormente sobre o Images 2.0. Enviei ao ChatGPT este prompt: “Crie um infográfico detalhado e vívido deste artigo usando o estilo da marca ZDNET e o logotipo ZDNET anexado.”

imagens-post.png

David Gewirtz via ChatGPT Images/ZDNET

Não apenas o logotipo está correto, mas a coloração é perfeita para ZDNET. Mas onde a imagem realmente brilha é no uso do texto. Todo o texto está correto, até mesmo o texto minúsculo em um ângulo da imagem.

Ele pode produzir esboços estilizados?

Em seguida, decidi revisitar o desafio de sketchnotes que dei ao Nano Banana do Google há alguns meses. A tarefa naquela época era criar uma versão em notas de esboço da Declaração de Direitos dos EUA. Nano Banana fez um ótimo trabalho com as imagens, mas tive que tentar várias vezes (e mais) para convencê-lo a acertar as palavras. Leia o artigo para ver os obstáculos que tive que superar.

Além disso: usei Nano Banana 2 para fazer esboços perfeitos: 5 lições aprendidas

Para ChatGPT Images 2.0, aumentei um pouco as apostas. Eu queria notas de esboço, mas as queria no estilo da marca ZDNET. Estou enfatizando o estilo da marca ao longo deste artigo porque essa é uma maneira pela qual o ChatGPT Images 2.0 pode fornecer valor real aos usuários.

Aqui está o primeiro prompt: “Faça-me um esboço da Declaração de Direitos dos EUA. Use o estilo do logotipo ZDNET e faça as notas no estilo ZDNET.” Essa é a imagem à esquerda. Aqui está o segundo prompt: “Inclua o logotipo ZDNET e adicione mais cores estilo neon, talvez em um fundo preto”. Essa é a imagem à direita.

notas de esboço

David Gewirtz via ChatGPT Images/ZDNET

Primeiro, observe que o texto está correto. Não há duplicatas. Não falta nada. Isso já está muito acima do desempenho do Nano Banana. Ambas as versões combinam com o estilo da ZDNET. A única coisa que não me agrada é que o logotipo da ZDNET parece preso na segunda imagem. Mesmo assim, o logotipo está correto e provavelmente eu poderia fazer mais algumas passagens rápidas para colocá-lo melhor.

Diversão maluca com um infográfico

Mas agora chegamos ao erro não forçado que meu conjunto de testes revelou. Pedi ao Images 2.0 para converter meu artigo sobre o construtor de sites de IA em um infográfico. Ele produziu um infográfico bastante utilizável, embora um tanto ocupado. Até fui para a internet e acrescentei informações que eu não tinha no artigo, como preço base.

infográfico-fixo

David Gewirtz via ChatGPT Images/ZDNET

Mas existem quatro erros claros:

  1. O cabeçalho destaca “aqui estão 9 dos melhores construtores de sites de IA”. Até faz o “9” se destacar. Exceto que apenas cinco construtores de sites foram revisados. Mais abaixo no infográfico, mostra os cinco que analiso. Ops.
  2. Os serviços que analisei foram Hostinger, GoDaddy, Wix, 10Web e Squarespace. O ChatGPT decidiu, por algum motivo, substituir o 10Web pelo Durável (concorrente do 10Web). Eu não revisei Durável. Eu nem mencionei Durável. Maluco.
  3. A IA produziu uma tabela de resumo para os serviços, listando classificações com estrelas para facilidade de uso, flexibilidade de design e recursos de IA. Mas não forneci classificações com estrelas para essas categorias. A IA foi excessivamente generosa com alguns fornecedores, de uma forma que contrariava diretamente o próprio texto da revisão. Chance.
  4. Finalmente, e isso é um problema, mas ainda assim. Bem na parte inferior, onde a IA reproduziu corretamente o logotipo ZDNET, há uma linha inclinada logo acima dele. Por que?

Além disso: Os melhores geradores de imagens de IA: agora há apenas um vencedor claro

Para ser justo, todos esses são erros que um designer gráfico humano interno pode produzir em um primeiro rascunho. Em meus anos como fundador e gerente de produto, certamente vi erros gráficos mais flagrantes vindos de meus designers em seus primeiros rascunhos.

Quando solicitei novamente as Imagens 2.0 com correções (exceto as avaliações com estrelas, que não corrigi na segunda imagem), ele modificou corretamente o infográfico com informações mais adequadas.

Imagens ChatGPT percorreram um longo caminho

Esta versão do Images 2.0 é uma grande melhoria em relação às versões anteriores. A versão ChatGPT Images que vi no ano passado foi impressionante, principalmente para recontextualizar imagens.

Além disso: dei uma olhada no ChatGPT Images 2.0 e é impressionante – com uma exceção

Esta nova versão, que pode interpretar o conteúdo real e depois criar imagens, é um grande salto em relação às versões anteriores. Mais especificamente, pode agregar um valor comercial muito tangível, o que faz com que valha muito não apenas para fotos divertidas, mas também para trabalho real.

Fique ligado, porque veremos como essa compilação se compara ao Nano Banana do Google Gemini. Irei ir ainda mais longe para ver em que outras tarefas relacionadas ao trabalho ele pode ajudar, especialmente quando se trata de design de interface de usuário.

Você se sente confortável em confiar em recursos visuais gerados por IA, sabendo que o modelo pode introduzir erros factuais sutis? Deixe-nos saber nos comentários abaixo.


Você pode acompanhar as atualizações diárias do meu projeto nas redes sociais. Certifique-se de se inscrever meu boletim informativo semanal de atualizaçãoe siga-me no Twitter/X em @DavidGewirtzno Facebook em Facebook.com/DavidGewirtzno Instagram em Instagram.com/DavidGewirtzno Bluesky em @DavidGewirtz.come no YouTube em YouTube.com/DavidGewirtzTV.



fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui