Alibaba Cloud otimiza uso de GPU para inferência de LLM, reduzindo necessidade em 82%

Publicado 20.10.2025, 07:15
© Reuters.

Investing.com -- A Alibaba Cloud publicou um artigo detalhando sua solução de otimização de recursos GPU Aegaeon para inferência concorrente de modelos de linguagem de grande porte (LLM), anunciou a empresa na segunda-feira.

O braço de computação em nuvem do Alibaba Group também revelou que conseguiu reduzir em 82% o número de GPUs necessárias na implementação por meio dessa nova abordagem.

A inferência de LLM normalmente envolve numerosas solicitações em rajada, o que cria desafios para o uso eficiente de GPU. A Alibaba Cloud melhorou a eficiência implementando um modelo que processa o trabalho com base em tokens, em vez de solicitações.

A solução acelera o processamento de inferência dividindo-o em duas fases - pré-preenchimento e decodificação - e tratando cada uma em pools separados de GPU.

Se comercializada, essa otimização provavelmente reduziria os custos dos servidores de inferência de IA e potencialmente aumentaria a demanda por semicondutores de servidor não-GPGPU e elementos de processamento especializado (SPE).

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.