Início Tecnologia Imagens ChatGPT 2: Por que a OpenAI construiu um novo modelo de...

Imagens ChatGPT 2: Por que a OpenAI construiu um novo modelo de imagem após matar Sora

16
0

Muita coisa mudou na indústria de IA nos quatro meses desde que a OpenAI lançou o ChatGPT Images 1.5. Vimos uma corrida acirrada para construir ferramentas de agência, um acordo sem precedentes com o Pentágono e um desperdício interminável de IA.

Agora, a OpenAI está de volta ao jogo de mídia generativa. A empresa anunciou na terça-feira que está lançando ChatGPT Images 2, seu modelo de imagem de próxima geração.

À esquerda: um anúncio de IA de uma loja matcha (falsa) em Brooklyn Heights. À direita: uma capa de revista AI chamada Open SciFi

ChatGPT Images 2 foi criado para criar designs com muito texto, como neste anúncio matcha e capa de revista falsa.

OpenAI/Compilado pela CNET

Pode parecer estranho que a OpenAI esteja lançando um novo modelo de imagem apenas um mês depois de anunciar o encerramento de seu outrora viral aplicativo de vídeo Sora AI, a fim de se concentrar na construção de “produtos principais” prontos para empresas. Mas fica claro pela forma como o novo modelo foi construído que a OpenAI não está retrocedendo nesse objetivo.

ChatGPT Images 2 foi projetado para produzir imagens com muito texto, incluindo infográficos, pôsteres científicos, guias de estudo e materiais de marketing. Os dias de vídeos estranhos de Sora e memes inspirados no Studio Ghibli acabaram.

Agora, a empresa está construindo uma IA que pode realizar o que chama de “tarefas criativas economicamente valiosas”.

“A abertura e os casos de uso da inteligência visual se expandem amplamente e acreditamos que isso é muito crítico para a visão do ChatGPT de desenvolver seu próprio assistente pessoal, porque seu assistente criativo é uma grande parte de quem você é como indivíduo”, disse Adele Li, líder de produto da ChatGPT Images, a repórteres em uma coletiva de imprensa.

(Divulgação: Ziff Davis, empresa controladora da CNET, em abril de 2025 entrou com uma ação judicial contra a OpenAI, alegando que ela infringiu os direitos autorais de Ziff Davis no treinamento e operação de seus sistemas de IA.)

À esquerda: um cartão de personagem de jogo para um personagem de anime chamado Kenji. À direita: um pôster educativo sobre pandas vermelhos

Nestes exemplos, você pode ver como o ChatGPT Images 2 é muito melhor na renderização de texto legível.

OpenAI/Compilado pela CNET

A OpenAI tem perseguido o sonho de um superaplicativo, um balcão único para todas as coisas de IA, construído a partir de sua plataforma Codex. ChatGPT Images 2 está trazendo a peça criativa desse quebra-cabeça.

O novo modelo melhora naturalmente a tipografia, a iconografia e a composição para produzir imagens de IA mais profissionais. Ele pode gerar texto em vários idiomas. Os modelos de imagem de IA têm notoriamente lutado para criar texto legível e factualmente correto. ChatGPT Images 2 é o melhor modelo da OpenAI para isso. O Google melhorou anteriormente sua renderização de texto com Nano Banana Promas mesmo esse modelo “melhor dos melhores” teve dificuldades com a precisão.

Atlas de IA

ChatGPT Images 2 está sendo lançado para todos os usuários agora. Seu limite de geração depende do seu plano: quanto mais você paga, mais imagens de IA você pode gerar.

Os desenvolvedores que usam o modelo na API podem criar imagens em resolução 2K e 4K, embora essas resoluções mais altas ainda estejam em beta e possam ser instáveis. Os usuários pagantes também podem criar imagens usando modelos de pensamento e raciocínio, que os ajudam a pesquisar informações na web, compilá-las em um design legível e verificar novamente seu trabalho.

“Modelo de imagem” não parece ser o termo certo para ChatGPT Images 2, embora seja tecnicamente correto. ChatGPT não captura o surrealismo fantástico das imagens de IA como Midjourney, nem oferece nem perto das ferramentas de edição do Adobe Firefly.

Mas atende a um grupo de usuários no meio do espectro dos entusiastas artísticos do Midjourney e dos criadores profissionais da Adobe: aqueles que precisam criar conteúdo atraente.

Como o Antrópico recém-lançado Claude DesignChatGPT Images 2 da OpenAI é voltado para profissionais que trabalham. Os professores podem usá-lo para criar guias de estudo e planos de aula ilustrados. Os gerentes de marketing podem criar postagens em mídias sociais e recursos visuais.

Você pode criar até oito imagens a partir de um único prompt, como um relatório de três páginas, que mantém a consistência visual em todas elas.

Páginas correspondentes para uma receita de torta de limão

Você pode fazer relatórios mais longos com ChatGPT Images 2, todas as páginas correspondentes.

OpenAI/Compilado pela CNET

Páginas correspondentes para uma receita de torta de limão

Esta é a segunda metade da receita de torta de limão gerada por IA. Observe a consistência visual.

OpenAI/Compilado pela CNET

Uma desvantagem é que se você quiser ajustar uma imagem de IA, ainda precisará regenerá-la. Com designs com mais texto, é mais provável que isso seja necessário, para que você administre seus créditos mais rapidamente. A OpenAI disse que está focada em manter seu fluxo de edição iterativo e baseado em prompts para mantê-lo fácil de usar.

Os procedimentos de segurança da OpenAI não mudaram significativamente desde o seu último modelo de imagem. Ainda inclui metadados através do padrão C2PA, para que as origens das imagens de IA possam ser identificadas. Imagens abusivas e ilegais ainda são proibidas nas políticas da OpenAI, uma barreira importante para as empresas de IA aplicarem de forma eficaz, dados os exemplos recentes de deepfakes gerados por IA e imagens íntimas não consensuais.



fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui