Início Tecnologia Cohere lança um modelo de voz de código aberto especificamente para transcrição

Cohere lança um modelo de voz de código aberto especificamente para transcrição

11
0

A empresa de IA empresarial Cohere lançou na quinta-feira seu primeiro modelo de voz: Transcribe é um modelo de reconhecimento automático de fala de código aberto que pode ser usado para tarefas como fazer anotações e análise de fala.

Relativamente leve com apenas 2 bilhões de parâmetros, o modelo foi projetado para uso com GPUs de consumo para aqueles que desejam hospedá-lo por conta própria. Atualmente suporta 14 idiomas: inglês, francês, alemão, italiano, espanhol, português, grego, holandês, polonês, chinês, japonês, coreano, vietnamita e árabe.

Cohere diz que o Transcribe supera modelos como Zoom Scribe v1, IBM Granite 4.0 1B, ElevenLabs Scribe v2 e Qwen3-ASR-1.7B Speech on a tabela de classificação Hugging Face Open ASRalcançando uma taxa média de erro de palavras (WER) de 5,42, inferior a qualquer outro modelo no benchmark.

A empresa afirma que o Transcribe teve uma taxa média de vitória de 61% em relação a outros modelos quando avaliadores humanos avaliaram suas transcrições quanto à precisão, coerência e usabilidade. Porém, o modelo ficou atrás dos rivais quando teve que transcrever português, alemão e espanhol.

Cohere diz que o Transcribe pode processar 525 minutos de áudio por minuto, o que é alto para sua classe de modelo.

A empresa está planejando integrar o Transcribe em sua plataforma de orquestração de agentes corporativos, Nortee está disponibilizando o modelo por meio de seu API de graça. O modelo também estará disponível em Cofre Modeloplataforma de inferência gerenciada da Cohere.

Os modelos de reconhecimento de fala estão se tornando cada vez mais populares à medida que cresce a demanda por aplicativos de anotações e ditados como Granola e Wispr Flow.

Evento Techcrunch

São Francisco, Califórnia
|
13 a 15 de outubro de 2026

No início deste ano, Cohere supostamente contado investidores que estava gerando uma receita recorrente anual de US$ 240 milhões em 2025, e seu CEO, Aidan Gomez, foi citado como tendo dito que a startup pode abrir o capital “em breve”.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui