da China DeepSeek lançou seu tão esperado novo modelo de inteligência artificial V4, dizendo que oferece recursos líderes mundiais e que uma versão de visualização já está disponível para uso.
A versão DeepSeek-V4 é supostamente melhor otimizada para Chips domésticos da China.
Ele “apresenta um contexto ultralongo de um milhão de palavras, alcançando liderança em campos domésticos e de código aberto em termos de capacidades de agente, conhecimento mundial e desempenho de raciocínio”, o empresa disse em um comunicado.
O novo modelo está disponível em duas versões, DeepSeek-V4-Pro e DeepSeek-V4-Flash, segundo a empresa, que afirma que esta última é uma “escolha mais eficiente e econômica”.
“Em benchmarks de conhecimento mundial, o DeepSeek-V4-Pro lidera significativamente outros modelos de código aberto e é apenas ligeiramente superado pelo modelo de código fechado de primeira linha, (do Google) Gemini-Pro-3.1”, disse a empresa de IA sediada em Hangzhou.
DeepSeek-V4-Pro vem com um “modo de esforço máximo de raciocínio”, que a startup de IA afirma “avançar significativamente as capacidades de conhecimento dos modelos de código aberto, estabelecendo-se firmemente como o melhor modelo de código aberto disponível hoje”.
A última atualização ocorre depois que a empresa provocou uma liquidação de trilhões de dólares no mercado de ações no ano passado, após o lançamento de seu modelo R1, que rivalizava em desempenho com sistemas de IA como o ChatGPT, embora fosse construído por apenas uma fração do custo.
A DeepSeek não revelou qual sistema de chip usou para treinar os modelos V4, mas disse que seus componentes de software são projetados para funcionar com chips Nvidia e Huawei.
O lançamento ocorre em meio a crescentes restrições à exportação de semicondutores dos EUA para a China, especialmente unidades de processamento gráfico (GPUs) de ponta, que são essenciais para a construção de modelos de IA, forçando a China a confiar em seus próprios fabricantes locais de GPU.
Mais segue













