Início Tecnologia OpenAI reforça o modelo de geração de imagens do ChatGPT

OpenAI reforça o modelo de geração de imagens do ChatGPT

28
0

OpenAI lançou um novo modelo de IA de geração de imagens na terça-feira, denominado ChatGPT Images 2.0. Este modelo pode gerar mais de uma imagem a partir de um único prompt, como um livreto de estudo inteiro, bem como texto de saída, inclusive em idiomas diferentes do inglês, como chinês e hindi. Esta versão está disponível globalmente para usuários do ChatGPT e Codex, com uma versão mais poderosa disponível para assinantes pagantes.

Quando qualquer grande empresa de IA lança um novo modelo de imagem, pode reavivar o interesse e aumentar a utilização, especialmente se os utilizadores das redes sociais adoptarem uma tendência capaz de meme, transformando imagens de si próprios. No ano passado, o lançamento do modelo Nano Banana pelo Google foi um grande momento para a empresa, especialmente quando os usuários começaram a postar estatuetas hiperrealistas de si mesmos on-line. No início deste ano, o ChatGPT Images causou sensação nas redes sociais à medida que os usuários compartilhavam Caricaturas geradas por IA.

O que há de diferente?

Como o novo modelo pode aproveitar os recursos de “raciocínio” do ChatGPT, o Images 2.0 pode pesquisar informações recentes na Internet e gerar mais de uma imagem por vez. Em essência, o bot pode usar etapas adicionais para gerar gerações mais completas a partir de um único prompt. As Imagens 2.0 também têm uma data limite de conhecimento mais recente: dezembro de 2025.

Isto também significa que os resultados do novo modelo são mais granulares. Por exemplo, gerei um infográfico com a previsão do tempo em São Francisco para o dia seguinte, bem como atividades que valem a pena realizar. A imagem gerada pelo ChatGPT incluía detalhes meteorológicos precisos para o dia chuvoso, junto com desenhos precisos do Ferry Building, do Castro Theatre, das casas Painted Ladies e da Transamerica Pyramid.

Além disso, o Images 2.0 é mais personalizável para usuários que desejam proporções exclusivas para saídas de imagens. O novo modelo pode gerar imagens que variam de 3:1 de largura a 1:3 de altura, e os usuários podem ajustar o tamanho da imagem como parte do prompt para a ferramenta de IA.

Primeiras impressões

Depois de algumas horas gerando imagens com o novo modelo, fiquei impressionado com os recursos de renderização de texto, pelo menos em inglês. Não faz muito tempo, as saídas de imagens com texto, de qualquer um dos principais modelos, geralmente incluíam vários caracteres malformados ou palavras com letras extras erradas. O ChatGPT lutou para rotular as imagens com precisão dois anos antes, portanto, os resultados mais limpos e complexos do Images 2.0 são um sinal de melhoria contínua. O Google também se concentrou em melhorar as saídas de imagens com texto em suas recentes iterações do Nano Banana.

A imagem pode conter Pôster publicitário Pessoa Bebida Café Xícara de café Roupas Casaco e jaqueta

IA GERADA POR REECE ROGERS

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui