Fique por dentro das principais notícias do mercado desta sexta-feira
Investing.com — Na corrida contínua para avançar as capacidades de inteligência artificial (IA) generativa, a startup chinesa DeepSeek disponibilizou silenciosamente um novo modelo especializado de IA de código aberto, segundo relatório do South China Morning Post. A medida ocorreu apenas um dia após a Alibaba (NYSE:BABA) lançar a terceira geração de sua família Qwen.
A startup com sede em Hangzhou carregou seu mais recente modelo Prover-V2 de código aberto no Hugging Face, a maior comunidade de IA de código aberto do mundo. Isso foi feito sem qualquer anúncio em seus canais oficiais de mídia social. A ação aumentou a expectativa pelo próximo modelo de raciocínio R2 da DeepSeek.
A série Prover da DeepSeek consiste em modelos específicos de domínio projetados para resolver problemas relacionados à matemática. A empresa ainda não forneceu detalhes sobre o novo modelo em sua página no Hugging Face. No entanto, os arquivos carregados sugerem que ele foi construído com base no modelo V3 da DeepSeek, que possui 671 bilhões de parâmetros e adota uma arquitetura de mistura de especialistas para treinamento e operação com eficiência de custo.
O desenvolvimento de um modelo focado em matemática levou a especulações de que a DeepSeek em breve lançará modelos adicionais. A empresa, no entanto, não respondeu a um pedido de comentário sobre este assunto.
Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.