O Google lançou seu mais recente modelo de raciocínio básico, Gemini 3.1 Pro, na quinta-feira. O Google afirma que o Gemini 3.1 Pro alcançou o dobro do desempenho verificado do 3 Pro no ARC-AGI-2, um benchmark popular que mede o raciocínio lógico de um modelo.
O Google lançou originalmente o Gemini 3 e 3 Pro em novembro, e este novo lançamento mostra a rapidez com que as empresas de IA estão introduzindo modelos novos e atualizados. Gemini 3.1 Pro é o novo modelo principal que alimenta o Gemini e várias ferramentas de IA do Google, como o Gemini 3 Deep Think. O Google diz que foi projetado para fornecer soluções mais criativas.
“O 3.1 Pro foi projetado para tarefas onde uma resposta simples não é suficiente, pegando o raciocínio avançado e tornando-o útil para os seus desafios mais difíceis”, disse um Postagem do blog do Google estados. “Essa inteligência aprimorada pode ajudar em aplicações práticas – quer você esteja procurando uma explicação clara e visual de um tópico complexo, uma maneira de sintetizar dados em uma única visualização ou dar vida a um projeto criativo.”
GPT-5.2 vs Gemini 3 – Como os dois modelos pesados se comparam em benchmarks, preço e conjunto de recursos
Aqui está tudo o que sabemos até agora sobre o Gemini 3.1 Pro, incluindo como ele se compara aos modelos mais recentes da Anthropic e OpenAI e como experimentá-lo você mesmo.
Como experimentar o Gemini 3.1 Pro
A partir de hoje, o Google está lançando o Gemini 3.1 Pro no aplicativo Gemini, na API Gemini e no Notebook LM. Os usuários gratuitos poderão experimentar o 3.1 Pro no aplicativo Gemini, mas os usuários pagos nos planos Google AI Pro e AI Ultra terão taxas de uso mais altas. Dentro do Notebook LM, apenas esses usuários pagos terão acesso ao 3.1 Pro, pelo menos por enquanto. Codificadores e usuários corporativos também podem acessar o novo modelo principal por meio de desenvolvedores e empresas podem acessar 3.1 por meio de AI Studio, Antigravity, Vertex AI, Gemini Enterprise, Gemini CLI e Android Studio.
Velocidade da luz mashável
Gemini 3.1 Pro já estava disponível para editores Mashable usando Gemini. Para experimentar você mesmo, vá para Gêmeos no desktop ou abra o aplicativo móvel Gemini.
Esquerda:
Dois resultados do mesmo prompt de animação.
Crédito: Google
Certo:
Crédito: Google
Por que o Gemini 3.1 Pro é importante
Quando o Google lançou o Gemini 3 Pro em novembro, o modelo era tão impressionante que supostamente fez com que o CEO da OpenAI, Sam Altman, declarasse um código vermelho. À medida que o Gemini 3 Pro subia ao topo das tabelas de classificação de IA, a OpenAI supostamente começou a perder usuários do ChatGPT para o Gemini. O mais recente modelo principal do ChatGPT, GPT-5.2, caiu na classificação em tabelas de classificação como Arena (anteriormente conhecida como LMArena), perdendo terreno significativo para concorrentes como Google, Anthropic e xAI.
Este Tweet não está disponível no momento. Pode estar carregando ou foi removido.
O Gemini 3 Pro já superava o GPT-5.2 em muitos benchmarks e, com um modelo de pensamento mais avançado, o Gemini poderia avançar ainda mais.
Gemini 3.1 Pro: desempenho de referência
O Google divulgou dados de desempenho de benchmark mostrando que o Gemini 3.1 Pro supera os modelos Gemini anteriores, Claude Sonnet 4.6, Claude Opus 4.6 e GPT-5.2. No entanto, o novo modelo de codificação da OpenAI, GPT-5.3-Codex, superou o Gemini 3.1 Pro no benchmark verificado SWE-Bench Pro, de acordo com o próprio Google.
Os destaques notáveis dos resultados de benchmark do Gemini 3.1 Pro incluem:
-
44,4 por cento no último exame da Humanidadeem comparação com 40,0 por cento para Claude Opus 4.6 e 34,5 por cento para GPT-5.2
-
77,1 por cento no ARC-AGI-2em comparação com 31,1 por cento para Gemini 3 Pro, 68,8 por cento para Claude Opus 4.6 e 52,9 por cento para GPT-5.2
-
94,3 por cento no GPQA Diamondem comparação com 91,9 por cento para Gemini 3 Pro, 91,3 por cento para Claude Opus 4.6 e 92,4 por cento para GPT-5.2
-
80,6 por cento no SWE-Bench verificadoem comparação com 76,2 por cento para Gemini 3 Pro, 80,8 por cento para Claude Opus 4.6 e 80,0 por cento para GPT-5.2
-
54,2 por cento no SWE-Bench Pro (Público)em comparação com 43,3 por cento para Gemini 3 Pro, 55,6 por cento para GPT-5.2 e 56,8 por cento para GPT-5.3-Codex
-
92,6 por cento no MMLUem comparação com 91,1 por cento para Claude Opus 4.6 e 89,6 por cento para GPT-5.2
O Google divulgou uma imagem mostrando os resultados completos do benchmark do Gemini 3.1 Pro:
Este Tweet não está disponível no momento. Pode estar carregando ou foi removido.
Divulgação: Ziff Davis, empresa controladora da Mashable, em abril de 2025 entrou com uma ação contra a OpenAI, alegando que ela infringiu os direitos autorais de Ziff Davis no treinamento e operação de seus sistemas de IA.













