Início Tecnologia OpenAI revela novo gerador de imagens para inaugurar um ‘renascimento’ de AI...

OpenAI revela novo gerador de imagens para inaugurar um ‘renascimento’ de AI Slop

17
0

A OpenAI acaba de lançar um novo gerador de imagens que afirma poder produzir dados mais inteligentes e precisos do que nunca.

ChatGPT Images 2.0 será um “renascimento” na geração de imagens de IA, de acordo com um anúncio promocional introdutório veiculado antes da transmissão ao vivo da OpenAI na terça-feira, anunciando a notícia.

“Se pensarmos em Dall-e como desenhos rupestres e nas Imagens 1.0 como arte antiga, então as Imagens 2.0 são a Renascença”, afirma o anúncio.

“O Images 2.0 é um grande avanço; é como passar do GPT-3 para o GPT-5 de uma só vez”, disse o CEO Sam Altman na transmissão ao vivo.

A empresa apresenta novos recursos multilíngues, melhor inteligência visual e maior atenção aos detalhes com o novo modelo, apresentando um prompt que gerou a imagem de uma tigela de arroz em que apenas um grão minúsculo tem o nome do modelo.

©OpenAI

O modelo possui dois modos: instantâneo e pensante. Os pesquisadores afirmaram que ambos os modos do modelo são significativamente melhores do que os recursos anteriores de geração de imagens no ChatGPT e que erros de digitação são “muito raros”.

O modo instantâneo é apenas uma versão mais rápida e renovada de um gerador de imagem típico, ao que parece, e agora está disponível para todos os usuários do ChatGPT e da API. O modo Thinking é mais complexo e está disponível apenas para usuários pagos, especificamente assinantes Plus, Pro e Business.

“Quando um modelo de pensamento é selecionado no ChatGPT, o Images 2.0 pode pesquisar informações em tempo real na web, criar várias imagens distintas a partir de um prompt e verificar novamente seus próprios resultados”, anunciou OpenAI em um comunicado. Comunicado de imprensa gerado pelo Images 2.0 e feito para parecer uma revista retrô.

Por exemplo, o modo Thinking pode gerar várias páginas de uma história em quadrinhos de mangá “com personagens recorrentes e histórias em evolução” ou páginas inteiras de revistas a partir de um único prompt simples, disse a empresa.

Exemplo de mangá OpenAI
Exemplo de painel de mangá gerado por Images 2.0 © OpenAI

Detetives online já esperavam esse lançamento há algum tempo. O modelo foi apelidado de “GPT-image-2” pelos entusiastas do Reddit e X. No início deste mês, um Reddit o usuário afirmou que a OpenAI estava testando o modelo com alguns usuários do ChatGPT. Mais ou menos na mesma época, um Usuário X afirmou que o modelo já estava em plataformas de teste de terceiros, como Arena AI, sob diferentes codinomes como “maskingtape-alpha”, “gaffertape-alpha” e “packingtape-alpha”. Na transmissão ao vivo, os engenheiros da OpenAI confirmaram que isso era verdade. A postagem X que apontou isso inclui fotos que o modelo supostamente produziu, que em sua maioria parecem impressionantes, exceto por um mapa-múndi com países inventados como “Ciger” e “Mharee”, e uma localização completamente confusa de capitais, como a localização da capital queniana de Nairóbi, na Arábia Saudita.

A OpenAI está se preparando para um suposto IPO que está previsto para este ano. Antes desse IPO, a empresa, que ainda supostamente longe da lucratividade apesar dos crescentes compromissos de despesas, tem estado a realizar um grande esforço para fazer com que as suas finanças pareçam tão desejáveis ​​quanto possível para potenciais investidores. Isso incluiu a mudança para uma empresa de utilidade pública com fins lucrativos e o desmantelamento do seu gerador de vídeo Sora para reduzir custos.

Se o novo modelo de gerador de imagens puder capturar o sucesso online que a geração anterior de imagens GPT-4o obteve com a mania do “Studio Ghibli” há pouco mais de um ano, ele poderá ajudar o ChatGPT a aumentar seu número de usuários ativos semanais, outro ponto importante a ser considerado pelos investidores. OpenAI anunciou em fevereiro que ChatGPT tinha violou 900 milhões de usuários ativos semanais, e o Imagens 2.0 poderia ajudar esses números a atingir o arbitrário, mas ainda mais impressionante, 1 bilhão.

Desta vez, parece que o momento viral que eles esperam é o fotorrealismo. Quando questionado por Altman na transmissão ao vivo, o pesquisador da OpenAI Gabriel Goh disse que o fotorrealismo é o estilo que o entusiasma mais no modelo e que “desencadeia algo muito interessante”.

Outra batalha que a OpenAI tem que travar é pela sua reputação.

A OpenAI deu início à mania da IA ​​com o lançamento do ChatGPT, um chatbot que se tornou não apenas um nome familiar, mas também quase sinônimo de tecnologia. Mas a posição de longa data da empresa como líder na corrida da IA ​​começou a enfrentar uma concorrência séria.

Um exemplo de fotorrealismo "sincero" imagem gerada por OpenAI
Um exemplo de imagem fotorrealista “sincera” gerada por Images 2.0 © OpenAI

Um desses golpes veio do principal rival da OpenAI, a Anthropic, cujos modelos de agentes como Claude Cowork e Claude Code têm feito a OpenAI suar. Em resposta, a OpenAI tem tentado fortalecer suas ofertas rivais como o Codex com atualizações.

O outro ataque veio do Google. No final do ano passado, a gigante da tecnologia atualizou seu gerador de imagens virais Nano Banana Pro e lançou o Gemini 3, ambos com grande alarde. Imediatamente após a recepção estelar dos lançamentos do Google, a OpenAI declarou “código vermelho” na empresa.

A concorrência que a OpenAI enfrenta tanto do Google quanto da Anthropic é tão grande que até o CEO da Nvidia, Jensen Huang, um parceiro importante, está preocupado com o domínio de mercado da OpenAI, de acordo com um relatório do Wall Street Journal do início deste ano. Se o gerador de imagens for bem-sucedido, isso poderá ajudar a acabar com alguns desses medos.

fonte