Início Tecnologia Google lança Gemini 3.1 Pro: desempenho de referência, como experimentá-lo

Google lança Gemini 3.1 Pro: desempenho de referência, como experimentá-lo

40
0

O Google lançou seu mais recente modelo de raciocínio básico, Gemini 3.1 Pro, na quinta-feira. O Google afirma que o Gemini 3.1 Pro alcançou o dobro do desempenho verificado do 3 Pro no ARC-AGI-2, um benchmark popular que mede o raciocínio lógico de um modelo.

O Google lançou originalmente o Gemini 3 e 3 Pro em novembro, e este novo lançamento mostra a rapidez com que as empresas de IA estão introduzindo modelos novos e atualizados. Gemini 3.1 Pro é o novo modelo principal que alimenta o Gemini e várias ferramentas de IA do Google, como o Gemini 3 Deep Think. O Google diz que foi projetado para fornecer soluções mais criativas.

“O 3.1 Pro foi projetado para tarefas onde uma resposta simples não é suficiente, pegando o raciocínio avançado e tornando-o útil para os seus desafios mais difíceis”, disse um Postagem do blog do Google estados. “Essa inteligência aprimorada pode ajudar em aplicações práticas – quer você esteja procurando uma explicação clara e visual de um tópico complexo, uma maneira de sintetizar dados em uma única visualização ou dar vida a um projeto criativo.”

VEJA TAMBÉM:

GPT-5.2 vs Gemini 3 – Como os dois modelos pesados ​​se comparam em benchmarks, preço e conjunto de recursos

Aqui está tudo o que sabemos até agora sobre o Gemini 3.1 Pro, incluindo como ele se compara aos modelos mais recentes da Anthropic e OpenAI e como experimentá-lo você mesmo.

Como experimentar o Gemini 3.1 Pro

A partir de hoje, o Google está lançando o Gemini 3.1 Pro no aplicativo Gemini, na API Gemini e no Notebook LM. Os usuários gratuitos poderão experimentar o 3.1 Pro no aplicativo Gemini, mas os usuários pagos nos planos Google AI Pro e AI Ultra terão taxas de uso mais altas. Dentro do Notebook LM, apenas esses usuários pagos terão acesso ao 3.1 Pro, pelo menos por enquanto. Codificadores e usuários corporativos também podem acessar o novo modelo principal por meio de desenvolvedores e empresas podem acessar 3.1 por meio de AI Studio, Antigravity, Vertex AI, Gemini Enterprise, Gemini CLI e Android Studio.

Gemini 3.1 Pro já estava disponível para editores Mashable usando Gemini. Para experimentar você mesmo, vá para Gêmeos no desktop ou abra o aplicativo móvel Gemini.

Esquerda:
Dois resultados do mesmo prompt de animação.
Crédito: Google

Certo:
Crédito: Google


Por que o Gemini 3.1 Pro é importante

Quando o Google lançou o Gemini 3 Pro em novembro, o modelo era tão impressionante que supostamente fez com que o CEO da OpenAI, Sam Altman, declarasse um código vermelho. À medida que o Gemini 3 Pro subia ao topo das tabelas de classificação de IA, a OpenAI supostamente começou a perder usuários do ChatGPT para o Gemini. O mais recente modelo principal do ChatGPT, GPT-5.2, caiu na classificação em tabelas de classificação como Arena (anteriormente conhecida como LMArena), perdendo terreno significativo para concorrentes como Google, Anthropic e xAI.

O Gemini 3 Pro já superava o GPT-5.2 em muitos benchmarks e, com um modelo de pensamento mais avançado, o Gemini poderia avançar ainda mais.

Gemini 3.1 Pro: desempenho de referência

O Google divulgou dados de desempenho de benchmark mostrando que o Gemini 3.1 Pro supera os modelos Gemini anteriores, Claude Sonnet 4.6, Claude Opus 4.6 e GPT-5.2. No entanto, o novo modelo de codificação da OpenAI, GPT-5.3-Codex, superou o Gemini 3.1 Pro no benchmark verificado SWE-Bench Pro, de acordo com o próprio Google.

Os destaques notáveis ​​dos resultados de benchmark do Gemini 3.1 Pro incluem:

  • 44,4 por cento no último exame da Humanidadeem comparação com 40,0 por cento para Claude Opus 4.6 e 34,5 por cento para GPT-5.2

  • 77,1 por cento no ARC-AGI-2em comparação com 31,1 por cento para Gemini 3 Pro, 68,8 por cento para Claude Opus 4.6 e 52,9 por cento para GPT-5.2

  • 94,3 por cento no GPQA Diamondem comparação com 91,9 por cento para Gemini 3 Pro, 91,3 por cento para Claude Opus 4.6 e 92,4 por cento para GPT-5.2

  • 80,6 por cento no SWE-Bench verificadoem comparação com 76,2 por cento para Gemini 3 Pro, 80,8 por cento para Claude Opus 4.6 e 80,0 por cento para GPT-5.2

  • 54,2 por cento no SWE-Bench Pro (Público)em comparação com 43,3 por cento para Gemini 3 Pro, 55,6 por cento para GPT-5.2 e 56,8 por cento para GPT-5.3-Codex

  • 92,6 por cento no MMLUem comparação com 91,1 por cento para Claude Opus 4.6 e 89,6 por cento para GPT-5.2

O Google divulgou uma imagem mostrando os resultados completos do benchmark do Gemini 3.1 Pro:


Divulgação: Ziff Davis, empresa controladora da Mashable, em abril de 2025 entrou com uma ação contra a OpenAI, alegando que ela infringiu os direitos autorais de Ziff Davis no treinamento e operação de seus sistemas de IA.



fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui