Por que os preços de memória dispararam no final do ano?

Publicado 30.11.2025, 05:37

Investing.com - Os preços de memória aumentaram significativamente nos últimos meses, à medida que cargas de trabalho de IA forçam os hiperescaladores a comprar muito mais DRAM e NAND do que o esperado.

A demanda relacionada à IA é mais complexa do que uma ampla expansão de data centers. Em vez disso, mudanças de software e alterações na arquitetura de modelos estão criando uma mudança radical na quantidade de memória que cada GPU consome, atraindo mais DRAM e NAND para cada cluster.

Um dos impulsionadores são as novas versões do software CUDA da Nvidia, que permitem às GPUs acessar pools maiores de memória em todo o sistema. Recursos no CUDA 12.8 e 13.0 permitem que os modelos tratem a memória da GPU e da CPU como um espaço unificado, facilitando a sobrescrição e incentivando os desenvolvedores a alocar conjuntos de trabalho muito maiores.

Isso significa que servidores de IA precisam de mais DRAM e mais capacidade de SSD em segundo plano para suportar paginação e armazenamento de dados de modelos.

A rápida expansão das janelas de contexto em modelos de linguagem grandes é outra mudança importante. À medida que os modelos processam entradas que chegam a centenas de milhares de tokens, a memória se torna o principal gargalo.

Essas sequências mais longas requerem significativamente mais VRAM para armazenar dados intermediários e, quando isso transborda, o sistema deve descarregar para a RAM do host ou SSDs. Os hiperescaladores adotaram essa hierarquia em larga escala, usando unidades NVMe como uma extensão da memória do sistema.

Contextos mais longos também exigem maior taxa de transferência de armazenamento. A leitura de grandes prompts em tempo real e o suporte a muitos usuários simultaneamente exigem NAND rápida e de alta capacidade.

Cargas de trabalho de inferência modernas envolvem leituras aleatórias frequentes em parâmetros de modelo e bancos de dados, que os SSDs lidam muito melhor do que os discos rígidos. Isso está levando os provedores de nuvem a expandir pools de armazenamento baseados em flash construídos com NAND de alto desempenho.

Analistas do BofA dizem que melhorias no CUDA e novos algoritmos de atenção reduzem alguma sobrecarga de memória, mas acabam permitindo cargas de trabalho maiores.

À medida que as GPUs processam sequências mais longas, os sistemas subjacentes devem suportar mais streaming de dados provenientes de SSDs. Projetos com múltiplas GPUs também desempenham um papel ao distribuir modelos e contextos massivos entre muitos aceleradores, o que aumenta as necessidades de memória agrupada e empurra mais dados para o flash.

Mercados de eletrônicos mais amplos também se recuperaram ao mesmo tempo em que a demanda de IA apertou o fornecimento, criando um "super ciclo" para memória.

Com a recuperação dos gastos em PCs, telefones e data centers tradicionais, o aumento em NAND e DRAM vinculado à IA deixou o estoque reduzido e elevou os preços drasticamente.

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.