A solução de rack NVIDIA GB200 requer mais otimização e ajustes em sua cadeia de suprimentos, de acordo com pesquisa recente da TrendForce. As especificações complexas de design do rack GB200, incluindo interfaces de interconexão de alta velocidade e requisitos de potência térmica de projeto (TDP) que excedem as normas do mercado, são as principais razões para essa necessidade. Como resultado, a TrendForce prevê que a produção em massa e o pico de envios provavelmente ocorrerão entre o 2º e o 3º trimestres de 2025.
A série de racks NVIDIA GB, que inclui os modelos GB200 e GB300, é caracterizada por tecnologia complexa e custos de produção mais elevados. Isso a torna uma solução preferida para grandes Provedores de Serviços em Nuvem (CSPs) e outros potenciais usuários, como data centers de nível 2, provedores de nuvem soberana nacional e instituições de pesquisa acadêmica que trabalham com aplicações de Computação de Alto Desempenho (HPC) e Inteligência Artificial (IA). Espera-se que o modelo GB200 NVL72 seja o mais popular em 2025, possivelmente representando até 80% das implantações totais à medida que a NVIDIA aumenta seus esforços de mercado.
A tecnologia proprietária NVLink da NVIDIA é parte integral da estratégia da empresa para melhorar o desempenho computacional de sistemas de servidores de IA e HPC. Essa tecnologia permite conexões de alta velocidade entre chips de GPU. O GB200 usa o NVLink de quinta geração, fornecendo uma largura de banda total que supera significativamente o atual padrão da indústria, PCIe 5.0.
O TDP do servidor HGX AI, que dominou em 2024, geralmente varia de 60 kW a 80 kW por rack. No entanto, o TDP do GB200 NVL72 atinge 140 kW por rack, dobrando os requisitos de energia. Isso levou os fabricantes a acelerar a adoção de soluções de resfriamento líquido, já que os métodos tradicionais de resfriamento a ar não conseguem lidar com cargas térmicas tão altas.
Os requisitos avançados de design para o GB200 levantaram preocupações sobre possíveis atrasos na disponibilidade de componentes e envios de sistemas. A TrendForce afirma que a produção de chips GPU Blackwell está progredindo em grande parte conforme o planejado, com apenas envios limitados esperados no 4º trimestre de 2024. Espera-se que o volume de produção aumente gradualmente a partir do 1º trimestre de 2025. No entanto, devido aos ajustes contínuos na cadeia de suprimentos para os componentes do sistema de servidor de IA, espera-se que os envios no final de 2024 sejam menores do que as expectativas da indústria. Como resultado, a TrendForce prevê que o período de pico de envio para o sistema de rack completo GB200 será adiado para entre o 2º e o 3º trimestres de 2025.
O TDP de 140 kW do GB200 NVL72 tornou o resfriamento líquido essencial, pois supera as capacidades das soluções tradicionais resfriadas a ar. A adoção de componentes de resfriamento líquido está ganhando impulso, com os principais players da indústria investindo pesadamente em pesquisa e desenvolvimento de tecnologias de resfriamento líquido.
Notavelmente, os fornecedores de unidades de distribuição de refrigerante estão se esforçando para melhorar a eficiência de resfriamento, aumentando o tamanho dos racks e desenvolvendo designs de placas frias mais eficientes. As CDUs laterais atuais podem dissipar entre 60 kW e 80 kW, mas espera-se que os designs futuros dobrem ou até tripliquem essa capacidade de resfriamento. O desenvolvimento de sistemas CDU em linha líquido-líquido permitiu que o desempenho de resfriamento excedesse 1,3 mW, com melhorias adicionais esperadas à medida que as demandas de poder computacional continuam a crescer.
Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.