Muita coisa mudou na indústria de IA nos quatro meses desde que a OpenAI lançou o ChatGPT Images 1.5. Vimos uma corrida acirrada para construir ferramentas de agência, um acordo sem precedentes com o Pentágono e um desperdício interminável de IA.
Agora, a OpenAI está de volta ao jogo de mídia generativa. A empresa anunciou na terça-feira que está lançando ChatGPT Images 2, seu modelo de imagem de próxima geração.
ChatGPT Images 2 foi criado para criar designs com muito texto, como neste anúncio matcha e capa de revista falsa.
Pode parecer estranho que a OpenAI esteja lançando um novo modelo de imagem apenas um mês depois de anunciar o encerramento de seu outrora viral aplicativo de vídeo Sora AI, a fim de se concentrar na construção de “produtos principais” prontos para empresas. Mas fica claro pela forma como o novo modelo foi construído que a OpenAI não está retrocedendo nesse objetivo.
ChatGPT Images 2 foi projetado para produzir imagens com muito texto, incluindo infográficos, pôsteres científicos, guias de estudo e materiais de marketing. Os dias de vídeos estranhos de Sora e memes inspirados no Studio Ghibli acabaram.
Agora, a empresa está construindo uma IA que pode realizar o que chama de “tarefas criativas economicamente valiosas”.
“A abertura e os casos de uso da inteligência visual se expandem amplamente e acreditamos que isso é muito crítico para a visão do ChatGPT de desenvolver seu próprio assistente pessoal, porque seu assistente criativo é uma grande parte de quem você é como indivíduo”, disse Adele Li, líder de produto da ChatGPT Images, a repórteres em uma coletiva de imprensa.
(Divulgação: Ziff Davis, empresa controladora da CNET, em abril de 2025 entrou com uma ação judicial contra a OpenAI, alegando que ela infringiu os direitos autorais de Ziff Davis no treinamento e operação de seus sistemas de IA.)
Nestes exemplos, você pode ver como o ChatGPT Images 2 é muito melhor na renderização de texto legível.
A OpenAI tem perseguido o sonho de um superaplicativo, um balcão único para todas as coisas de IA, construído a partir de sua plataforma Codex. ChatGPT Images 2 está trazendo a peça criativa desse quebra-cabeça.
O novo modelo melhora naturalmente a tipografia, a iconografia e a composição para produzir imagens de IA mais profissionais. Ele pode gerar texto em vários idiomas. Os modelos de imagem de IA têm notoriamente lutado para criar texto legível e factualmente correto. ChatGPT Images 2 é o melhor modelo da OpenAI para isso. O Google melhorou anteriormente sua renderização de texto com Nano Banana Promas mesmo esse modelo “melhor dos melhores” teve dificuldades com a precisão.
ChatGPT Images 2 está sendo lançado para todos os usuários agora. Seu limite de geração depende do seu plano: quanto mais você paga, mais imagens de IA você pode gerar.
Os desenvolvedores que usam o modelo na API podem criar imagens em resolução 2K e 4K, embora essas resoluções mais altas ainda estejam em beta e possam ser instáveis. Os usuários pagantes também podem criar imagens usando modelos de pensamento e raciocínio, que os ajudam a pesquisar informações na web, compilá-las em um design legível e verificar novamente seu trabalho.
“Modelo de imagem” não parece ser o termo certo para ChatGPT Images 2, embora seja tecnicamente correto. ChatGPT não captura o surrealismo fantástico das imagens de IA como Midjourney, nem oferece nem perto das ferramentas de edição do Adobe Firefly.
Mas atende a um grupo de usuários no meio do espectro dos entusiastas artísticos do Midjourney e dos criadores profissionais da Adobe: aqueles que precisam criar conteúdo atraente.
Como o Antrópico recém-lançado Claude DesignChatGPT Images 2 da OpenAI é voltado para profissionais que trabalham. Os professores podem usá-lo para criar guias de estudo e planos de aula ilustrados. Os gerentes de marketing podem criar postagens em mídias sociais e recursos visuais.
Você pode criar até oito imagens a partir de um único prompt, como um relatório de três páginas, que mantém a consistência visual em todas elas.
Você pode fazer relatórios mais longos com ChatGPT Images 2, todas as páginas correspondentes.
Esta é a segunda metade da receita de torta de limão gerada por IA. Observe a consistência visual.
Uma desvantagem é que se você quiser ajustar uma imagem de IA, ainda precisará regenerá-la. Com designs com mais texto, é mais provável que isso seja necessário, para que você administre seus créditos mais rapidamente. A OpenAI disse que está focada em manter seu fluxo de edição iterativo e baseado em prompts para mantê-lo fácil de usar.
Os procedimentos de segurança da OpenAI não mudaram significativamente desde o seu último modelo de imagem. Ainda inclui metadados através do padrão C2PA, para que as origens das imagens de IA possam ser identificadas. Imagens abusivas e ilegais ainda são proibidas nas políticas da OpenAI, uma barreira importante para as empresas de IA aplicarem de forma eficaz, dados os exemplos recentes de deepfakes gerados por IA e imagens íntimas não consensuais.












