Cursor, uma plataforma de codificação de IA de São Francisco da startup Anysphere avaliado em US$ 29,3 bilhõeslançou Compositor 2um novo modelo de codificação interno agora disponível em seu ambiente de codificação de IA agente e oferece benchmarks drasticamente aprimorados em relação ao modelo interno anterior.
Também está lançando e fazendo Compositor 2 Rápidouma variante mais cara, mas mais rápida, a experiência padrão para os usuários.
Aqui está o detalhamento dos custos:
Isso é uma grande queda em relação ao modelo interno antecessor do Cursor, Composer 1.5, de fevereiroque custa US$ 3,50 por milhão de tokens de entrada e US$ 17,50 por milhão de tokens de saída; Composer 2 é cerca de 86% mais barato em ambos os aspectos.
Composer 2 Fast também é aproximadamente 57% mais barato que o Composer 1.5.
Também há descontos para “preços de leitura de cache”, ou seja, enviar alguns dos mesmos tokens em um prompt para o modelo novamente, de US$ 0,20 por milhão de tokens para o Composer 2 e US$ 0,35 por milhão para o Composer 2 Fast, contra US$ 0,35 por milhão para o Composer 1.5.
Também é importante que esta pareça ser uma versão nativa do Cursor, e não um modelo independente amplamente distribuído. No anúncio da empresa e na documentação do modelo, o Composer 2 é descrito como disponível no Cursor, ajustado para o fluxo de trabalho do agente do Cursor e integrado à pilha de ferramentas do produto.
Os materiais fornecidos não indicam disponibilidade separada por meio de plataformas de modelo externas ou como uma API de uso geral fora do ambiente Cursor.
O Cursor está lançando codificação de longo horizonte, não apenas melhores conclusões
A afirmação técnica mais profunda nesta versão não é apenas que o Composer 2 tem pontuação superior ao Composer 1.5. É que Cursor diz que o modelo é mais adequado para codificação agente de longo horizonte.
Em seu blog, o Cursor afirma que os ganhos de qualidade vêm de sua primeira execução contínua de pré-treinamento, que lhe proporcionou uma base mais forte para o aprendizado por reforço escalonado. A partir daí, a empresa afirma que treinou o Composer 2 em tarefas de codificação de longo horizonte e que o modelo pode resolver problemas que exigem centenas de ações.
Esse enquadramento é importante porque aborda um dos maiores problemas não resolvidos na codificação da IA. Muitos modelos são bons na geração de código isolado. Muito menos permanecem confiáveis em um fluxo de trabalho mais longo que inclui a leitura de um repositório, a decisão do que alterar, a edição de vários arquivos, a execução de comandos, a interpretação de falhas e a continuação em direção a uma meta.
A documentação do Cursor reforça que este é o caso de uso que lhe interessa. Ele descreve o Composer 2 como um modelo de agente com uma janela de contexto de 200.000 tokens, ajustado para uso de ferramentas, edições de arquivos e operações de terminal dentro do Cursor.
Ele também observa técnicas de treinamento, como auto-resumo para tarefas de longa duração. Para desenvolvedores que já usam o Cursor como ambiente principal, esse ajuste mais rígido pode ser mais importante do que uma reivindicação genérica de tabela de classificação.
Os ganhos do benchmark são substanciais, mesmo que o GPT-5.4 ainda lidere em um gráfico importante
Os resultados publicados do Cursor mostram uma clara melhoria em relação aos modelos anteriores do Composer. A empresa lista o Composer 2 em 61,3 no CursorBench, 61,7 no Terminal-Bench 2.0 e 73,7 no SWE-bench Multilingual.
Isso se compara ao Composer 1.5 em 44,2, 47,9 e 65,9, e ao Composer 1 em 38,0, 40,0 e 56,9.
O lançamento é mais comedido do que alguns lançamentos de modelos porque o Cursor não está reivindicando liderança universal.
No Terminal-Bench 2.0, que mede quão bem um agente de IA executa tarefas em interfaces de linha de comando estilo terminal, GPT-5.4 ainda lidera com 75,1, enquanto o Composer 2 pontua 61,7, à frente do Opus 4.6 com 58,0, Opus 4.5 com 52,1 e Composer 1,5 com 47,9.
Isso torna o discurso do Cursor mais pragmático e possivelmente mais útil para os compradores. A empresa não está dizendo que o Composer 2 é o melhor modelo em tudo. Diz-se que o modelo passou para um nível de qualidade mais competitivo, ao mesmo tempo que oferece uma economia mais atrativa e uma integração mais forte com os produtos que os desenvolvedores já utilizam.
O Cursor também incluiu um gráfico de desempenho versus custo em seu conjunto de benchmarking CursorBench que parece projetado para apresentar um argumento no estilo Pareto para o Composer 2.
Nesse gráfico, o Composer 2 apresenta um ponto de custo-desempenho mais forte do que o Composer 1.5 e se compara favoravelmente com as configurações de custo mais alto do GPT-5.4 e Opus 4.6 mostradas pelo Cursor. A mensagem da empresa não é simplesmente que o Composer 2 tenha uma pontuação mais alta que seu antecessor, mas que ele pode oferecer uma compensação mais eficiente entre custo e inteligência para o trabalho diário de codificação dentro do Cursor.
Por que o ponto “bloqueado no Cursor” é importante para os compradores
Para os leitores que decidem usar o Composer 2, a questão mais importante pode não ser apenas o desempenho do benchmark. Pode ser se eles desejam um modelo otimizado para a experiência de produto do próprio Cursor.
Isso pode ser um ponto forte. De acordo com a documentação, o Composer 2 pode acessar a pilha de ferramentas do agente do Cursor, incluindo pesquisa de código semântico, pesquisa de arquivos e pastas, leituras de arquivos, edições de arquivos, comandos shell, controle de navegador e acesso à web.
Esse tipo de integração pode ser mais valioso do que a qualidade bruta do modelo se o objetivo for concluir tarefas reais de software, em vez de produzir respostas únicas e impressionantes.
Mas também restringe o público-alvo. As equipes que procuram um modelo que possam implantar amplamente em diversas ferramentas e plataformas externas devem reconhecer que o Cursor está apresentando o Composer 2 como um modelo para usuários do Cursor, e não como um modelo básico independente e geralmente disponível.
Panorama geral: o Cursor está apresentando um argumento operacional
A importância do Composer 2 não é que o Cursor tenha subitamente assumido o primeiro lugar em todos os benchmarks de codificação. Não foi assim. O ponto mais importante é que o Cursor apresenta um argumento operacional: o seu modelo está a melhorar, o seu preço é suficientemente baixo para encorajar uma utilização mais ampla e o seu nível mais rápido é suficientemente responsivo para que a empresa se sinta confortável em torná-lo o padrão, apesar do custo mais elevado.
Essa combinação pode repercutir nas equipes de engenharia que se preocupam cada vez menos com o prestígio do modelo abstrato e mais com se um assistente pode permanecer útil durante longas sessões de codificação sem se tornar proibitivamente caro.
O cursor é mais amplo estrutura de preços ajuda a enquadrar a pressão competitiva em torno deste lançamento. Em sua página de preços atual, o Cursor oferece um nível Hobby gratuito, um Plano Pro de $ 20 por mês, Pro + por $ 60 por mêse Ultra por US$ 200 por mês para usuários individuais, com níveis mais altos oferecendo mais uso em modelos da OpenAI, Anthropic e Google.
Do lado empresarial, As equipes custam US$ 40 por usuário por mêsenquanto o Enterprise tem preço personalizado e adiciona uso em pool, faturamento centralizado, análise de uso, controles de privacidade, SSO, registros de auditoria e controles administrativos granulares. Em outras palavras, o Cursor não cobra apenas pelo acesso a um modelo de codificação. Ela está cobrando por uma camada de aplicativo gerenciada que se baseia em vários provedores de modelos, ao mesmo tempo em que adiciona recursos de equipe, governança e ferramentas de fluxo de trabalho.
Esse modelo está cada vez mais sob pressão à medida que as empresas primárias de IA se aprofundam na própria codificação. OpenAI e Anthropic não estão mais apenas vendendo modelos por meio de produtos de terceiros; eles também estão lançando suas próprias interfaces de codificação, agentes e estruturas de avaliação — como Codex e Claude Code — levantando a questão de quanto espaço resta para uma plataforma intermediária.
Os comentaristas do X, embora não verificados e não necessariamente representativos do mercado mais amplo, têm descrito cada vez mais a mudança do Cursor para o Código Claude da Anthropic, especialmente entre usuários avançados atraídos por fluxos de trabalho que priorizam o terminal, comportamento de agente de execução mais longa e menor sobrecarga percebida.
Algumas dessas postagens descrevem a frustração com o preço do Cursor, a perda de contexto ou a experiência centrada no editor, ao mesmo tempo que elogiam o Claude Code como uma forma de trabalhar mais direta e totalmente agente. Mesmo tratado com cautela, esse tipo de conversa social aponta para o problema estratégico que o Cursor enfrenta: ele tem que provar que sua plataforma integrada, controles de equipe e agora seus próprios modelos internos agregam valor suficiente para justificar ficar entre os desenvolvedores e os produtos de codificação cada vez mais capazes dos criadores de modelos.
Isso torna o Composer 2 estrategicamente importante para o Cursor.
Ao oferecer um modelo interno muito mais barato que o Composer 1.5, ajustando-o firmemente à pilha de ferramentas do Cursor e tornando uma versão mais rápida o padrão, a empresa está tentando mostrar que fornece mais do que um wrapper para sistemas externos.
O desafio é que, à medida que os produtos de codificação originais melhoram, os desenvolvedores e compradores empresariais podem cada vez mais perguntar se desejam uma plataforma de codificação de IA separada ou se as próprias ferramentas dos criadores de modelos estão se tornando suficientes por si só.












