Bitcoin segue em compasso de espera após corte de juros nos EUA
Investing.com - A desenvolvedora chinesa de IA DeepSeek afirmou que gastou apenas US$ 294.000 para treinar seu modelo de inteligência artificial R1.
A estimativa de custo, revelada pela primeira vez pela empresa de Hangzhou, foi publicada em um artigo revisado por pares na revista acadêmica Nature na quarta-feira. O documento revelou que a DeepSeek utilizou 512 chips Nvidia H800 para treinar o modelo focado em raciocínio durante um período de 80 horas.
Os chips H800 utilizados pela DeepSeek foram especificamente projetados pela Nvidia para o mercado chinês após os EUA proibirem a exportação dos chips de IA mais potentes H100 e A100 para a China em outubro de 2022.
Em informações complementares que acompanham o artigo na Nature, a DeepSeek reconheceu pela primeira vez que possui chips A100, os quais foram utilizados nas etapas preparatórias de desenvolvimento. "Em relação à nossa pesquisa sobre o DeepSeek-R1, utilizamos as GPUs A100 para preparar os experimentos com um modelo menor", escreveram os pesquisadores.
Esta revelação contrasta fortemente com as declarações do CEO da OpenAI, Sam Altman, que indicou em 2023 que o "treinamento de modelos fundamentais" em sua empresa custou "muito mais" que US$ 100 milhões, embora a OpenAI não tenha fornecido números detalhados para seus lançamentos.
Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.