Início Tecnologia GPT-5.3 Instant reduz as alucinações em 26,8% à medida que OpenAI muda...

GPT-5.3 Instant reduz as alucinações em 26,8% à medida que OpenAI muda o foco da velocidade para a precisão

17
0

O GPT-5.3 Instant da OpenAI – o modelo mais usado pela empresa – reduz as alucinações em até 26,8% em comparação com seu antecessor, priorizando a precisão e a confiabilidade da conversação em detrimento dos ganhos brutos de desempenho, diz a OpenAI.

GPT-5.3 Instant, que é essencialmente o padrão e o modelo mais utilizado pelos usuários do ChatGPT, também melhora o tom, a relevância e a conversa com menos recusas. Está disponível no ChatGPT e na API.

No momento, apenas o modelo Instant será atualizado para 5.3, mas a empresa disse que está trabalhando na atualização dos outros modelos ChatGPT, Thinking e Pro para 5.3 “em breve”.

GPT-5.3 Instant reduz as alucinações em até 26,8%

A OpenAI realizou duas avaliações internas: uma em domínios de maior risco, incluindo medicina, finanças e direito; o outro baseia-se no feedback do usuário.

Com base em avaliações de alto risco realizadas pela empresa, o GPT-5.3 Instant reduz as alucinações em 26,8% ao usar a web. Melhora a confiabilidade em 19,7% ao contar com seu conhecimento interno. O feedback do usuário mostrou uma redução de 22,5% nas alucinações ao responder perguntas usando a pesquisa na web.

A empresa disse que o GPT-5.3 Instant é mais confiável porque melhorou a forma como equilibra as informações da Internet com seu próprio treinamento e raciocínio interno.

“De forma mais ampla, o GPT-5.3 Instant tem menos probabilidade de indexar excessivamente os resultados da web, o que anteriormente poderia levar a longas listas de links ou informações pouco conectadas. Ele faz um trabalho mais forte ao reconhecer o subtexto das perguntas e trazer à tona as informações mais importantes, especialmente iniciais, resultando em respostas que são mais relevantes e imediatamente utilizáveis, sem sacrificar a velocidade ou o tom”, disse a empresa.

Um exemplo dado pela OpenAI é quando um usuário pergunta sobre a maior contratação da Liga Principal de Beisebol e seu impacto. O modelo anterior, GPT-5.2, geralmente resumia os resultados da pesquisa por padrão.

A precisão supera o desempenho como ponto de venda da OpenAI

Com este novo lançamento, primeiro em seu modelo mais usado, a OpenAI deseja que os clientes corporativos e outros usuários do ChatGPT entendam que a frente de batalha não é apenas sobre o desempenho de um modelo, mas também sobre quão bem ele pode aderir às informações reais. Em vez de se concentrar em métricas de desempenho, como velocidade e economia de tokens, a empresa está se apoiando mais na confiabilidade do GPT-5.3 Instant.

Concorrentes como Google e Anthropic também apregoam maior precisão em seus novos modelos. A Anthropic disse que seu novo Claude Sonnet 4.6 tem menos alucinações, enquanto o Google foi forçado a retirar seu modelo Gemma 3 depois de ter alucinado informações falsas sobre um legislador.

GPT-5.3 Instant disca recusas e tom de “constrangimento”

“Esta atualização se concentra nas partes da experiência do ChatGPT que as pessoas sentem todos os dias: tom, relevância e fluxo de conversação. Esses são problemas sutis que nem sempre aparecem nos benchmarks, mas determinam se o ChatGPT parece útil ou frustrante. O GPT-5.3 Instant reflete diretamente o feedback do usuário nessas áreas.” OpenAI disse em uma postagem no blog.

GPT-5.3 Instant tem um estilo de conversa mais natural, afastando-se do que a OpenAI alegou ser um tom “constrangedor” que parecia arrogante e fazia suposições sobre a intenção do usuário. A empresa observou que garantirá que a personalidade da plataforma de bate-papo seja mais consistente nas atualizações, para que os usuários não experimentem uma mudança de tom ao conversar com o modelo.

O novo modelo reduz significativamente as recusas. A OpenAI disse que o modelo anterior muitas vezes se recusava a responder perguntas, mesmo quando elas não violavam nenhuma proteção. Às vezes, o modelo anterior responde “de maneiras que parecem excessivamente cautelosas ou enfadonhas, especialmente em torno de tópicos delicados”.

A empresa promete que o GPT-5.3 não fará o mesmo e suavizará “preâmbulos excessivamente defensivos ou moralizantes”. Isso significa que o modelo responderá diretamente, sem ressalvas, para que os usuários não encerrem as conversas sem uma resposta à sua consulta.

Apesar disso, o GPT-5.3 Instant ainda enfrenta algumas limitações, especialmente em alguns idiomas como coreano e japonês, onde as respostas ainda parecem artificiais.

Cartão de segurança mostra regressões em conteúdo sexual e categorias de automutilação

O novo modelo não tem suporte para conteúdo adulto, de acordo com um porta-voz da OpenAI em e-mail para VentureBeat, já que a empresa ainda está descobrindo “como maximizar a liberdade do usuário enquanto mantém nossa alta barra de segurança”. A OpenAI não tem um cronograma para o lançamento dessa funcionalidade.

A OpenAI conduziu benchmarking de segurança no novo modelo, observando em seu cartão de segurança que, embora tenha tido um bom desempenho contra conteúdo não permitido, ainda não correspondeu ao nível do GPT-5.2 Instant. No entanto, a OpenAI observou que estes resultados podem mudar após o lançamento.

“GPT-5.3 Instant mostra regressões em relação ao GPT-5.2 Instant e GPT-5.1 Instant para conteúdo sexual não permitido e em relação ao GPT-5.2 Instant para automutilação em avaliações padrão e dinâmicas”, disse a empresa.

Em outras categorias, a OpenAI disse que o modelo tem desempenho igual ou melhor que os lançamentos anteriores e observou que as regressões para violência gráfica e comportamento ilícito violento têm baixa significância estatística.

Espera um novo modelo em breve?

Depois de anunciar o GPT-5.3 Instant e observar que as atualizações para Thinking e Pro chegarão em breve, a OpenAI provocou que mesmo este novo modelo poderia estar sendo aposentado.

Em um postar no XOpenAI disse que o GPT-5.4 chegará “mais cedo do que você pensa”.

A OpenAI não detalhou quais mudanças, se houver, podemos esperar do GPT-5.4 e quais modos serão implementados primeiro.

GPT-5.2 Instant, o modelo antecessor, permanecerá disponível no seletor de modelos ChatGPT até 3 de junho, quando será retirado.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui