A OpenAI lançou seu modelo mais recente, GPT-5.5, em 23 de abril, apenas uma semana depois que a Anthropic lançou o Claude Opus 4.7.
Como os dois principais modelos dos dois principais laboratórios de IA, queríamos ver como os novos modelos se comparam.
Alerta de spoiler: Achamos que Claude Opus 4.7 tem uma vantagem em codificação avançada e de agente, mas o GPT-5.5 tem melhor desempenho na maioria dos benchmarks.
Anthropic diz que Claude Opus 4.7 tem uma taxa de honestidade de 92%, menos bajulação
Quer saber mais sobre como tirar o melhor proveito da sua tecnologia? Inscreva-se nos boletins informativos de notícias e ofertas principais do Mashable hoje.
GPT-5.5 e Opus 4.7: Tabelas de classificação
O GPT-5.5 ainda não está classificado em todas as tabelas de classificação de IA, mas deve ser muito competitivo com Claude Opus 4.7. Nas tabelas de classificação de testes de benchmark verificados, como Prêmio ArcoGPT-5.5 vence Opus 4.7 (mais sobre isso abaixo).
No popular Tabela de classificação da arenaque é baseado em testes de usuários, Claude Opus 4.7 Thinking ocupa o primeiro lugar geral. Curiosamente, o Opus 4.7 está atualmente classificado abaixo do Opus 4.6, embora isso provavelmente mude com o tempo. Atualmente, os novos modelos antrópicos ocupam os quatro primeiros lugares gerais. Além do mais, o inédito Claude Mythos da Anthropic não está classificado, e a Anthropic diz que tem um desempenho ainda melhor do que o Opus 4.7.
No Índice de Capacidades da Época (ECI) tabela de classificação, GPT-5.4 Pro tem a pontuação máxima por enquanto. (ECI combina vários benchmarks em uma única pontuação.) Você encontrará Gemini 3.1 Pro e GPT-5.4 na segunda e terceira posições.
A capacidade da IA de encontrar os principais bugs de software está crescendo 490% ano após ano
GPT-5.5 e Opus 4.7: benchmarks
Qual é o desempenho dos novos modelos nos testes de benchmark mais comuns? Temos que confiar principalmente nas pontuações autorrelatadas da OpenAI e da Anthropic para esses testes. Ambos alcançam notas altas, como seria de esperar, mas o GPT-5.5 definitivamente tem vantagem.
Veja como eles se comparam em alguns dos principais testes de benchmark de IA:
Velocidade da luz mashável
-
SWE-Bench Pro: GPT-5,5 pontuou 58,6; Opus 4.7 obteve 64,3 por cento
-
Terminal-banco 2.0: GPT-5.5 obteve 82,7 por cento; Opus 4.7 obteve 69,4 por cento
-
Último Exame da Humanidade: GPT-5.5 obteve 40,6 por cento; Opus 4.7 obteve 31,2%*
-
Último Exame da Humanidade (com ferramentas): GPT-5.5 obteve 52,2 por cento; Opus 4.7 obteve 54,7 por cento
-
NavegarComp: GPT-5.5 obteve 84,4 por cento; Opus 4.7 obteve 79,3 por cento
-
Diamante GPQA: GPT-5.5 obteve 93,6 por cento; Opus 4.7 obteve 94,2 por cento
-
ARC-AGI-1 (verificado): GPT-5.5 (Alto) obteve 94,5 por cento; Claude 4,7 (Alto) obteve 92 por cento**
-
ARC-AGI-2 (verificado): GPT-5.5 (Alto) obteve 83,3 por cento; Claude 4,7 (Alto) obteve 68,3 por cento**
*Para o Último Exame da Humanidade, estamos citando Resultados HLE verificados da Análise Artificial. Notavelmente, a Anthropic relata que o Opus 4.7 obteve 46,9 por cento neste teste.
**Veja os resultados completos no Site do Prêmio Arc.
GPT 5.5 e Opus 4.7: Disponibilidade e preços
A OpenAI afirma que o GPT 5.5 é “nosso modelo mais inteligente e intuitivo de usar até agora”. Claude Opus 4.7 é o modelo mais avançado da Anthropic disponível para usuários de Claude, embora a Anthropic diga que o inédito Claude Mythos Preview é o modelo mais capaz em geral.
Como tal, apenas assinantes pagos podem aceder a estes modelos de fronteira.
GPT 5.5 está disponível apenas para usuários OpenAI Plus, Pro, Business e Enterprise em ChatGPT e Codex (desculpe, usuários ChatGPT Go). Os usuários Pro, Business e Enterprise também podem acessar o GPT-5.5 Pro, enquanto os clientes Plus, Pro, Business e Enterprise podem acessar o GPT-5.5 Thinking.
A OpenAI está aumentando os preços do GPT-5.5 em sua API, embora a empresa diga que é mais eficiente em termos de tokens. O preço da API começa em “US$ 5 por 1 milhão de tokens de entrada e US$ 30 por 1 milhão de tokens de saída, com uma janela de contexto de 1 milhão”.
Opus 4.7 está disponível para clientes Pro e Max; por meio da API, está disponível por “US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída”.
GPT-5.5 e Opus 4.7: conjunto de recursos
A OpenAI afirma que o GPT-5.5 traz melhorias visíveis na “codificação agente, uso do computador, trabalho de conhecimento e pesquisas científicas iniciais”. A Anthropic diz que Claude Opus 4.7 melhora em codificação avançada, inteligência visual e análise de documentos.
ChatGPT e Claude têm conjuntos de recursos gerais semelhantes, embora haja algumas exceções. Em termos gerais, você pode usar esses dois chatbots de IA para pesquisa, codificação, projetos criativos e trabalho profissional diário. Você também pode usar os dois novos modelos nas plataformas de codificação OpenAI e Anthropic, Codex e Claude Code.
É mais fácil falar das diferenças do que das semelhanças. Embora GPT-5.5 não seja um modelo de imagem, no ChatGPT você pode usar o novo Modelo ChatGPT Imagens 2.0. Antrópico lançado recentemente Claudio Designmas oferece apenas visualizações de dados, gráficos e slides, e não geração completa de imagens. Portanto, caso você precise gerar imagens ou gráficos interativos para um projeto, o GPT-5.5 terá mais ferramentas disponíveis para chamar.
GPT-5.5 pode ser usado para criar visualizações de dados complexas e interativas.
Crédito: OpenAI
ChatGPT tem mais integrações de aplicativos e compras, embora graças à recente aquisição do OpenClaw, a Anthropic tenha vantagem em recursos de agência.
DR: Se tivéssemos que escolher um desses modelos para o trabalho profissional diário, o GPT-5.5 teria vantagem graças ao conjunto geral mais amplo de recursos do ChatGPT. No entanto, para codificação avançada e de agente, optaríamos por Claude Opus 4.7.
Divulgação: Ziff Davis, empresa controladora da Mashable, em abril de 2025 entrou com uma ação contra a OpenAI, alegando que ela infringiu os direitos autorais de Ziff Davis no treinamento e operação de seus sistemas de IA.











