Alibaba Cloud otimiza uso de GPU para inferência de LLM, reduzindo necessidade em 82%

Publicado 20.10.2025, 07:15

Investing.com -- A Alibaba Cloud publicou um artigo detalhando sua solução de otimização de recursos GPU Aegaeon para inferência concorrente de modelos de linguagem de grande porte (LLM), anunciou a empresa na segunda-feira.

O braço de computação em nuvem do Alibaba Group também revelou que conseguiu reduzir em 82% o número de GPUs necessárias na implementação por meio dessa nova abordagem.

A inferência de LLM normalmente envolve numerosas solicitações em rajada, o que cria desafios para o uso eficiente de GPU. A Alibaba Cloud melhorou a eficiência implementando um modelo que processa o trabalho com base em tokens, em vez de solicitações.

A solução acelera o processamento de inferência dividindo-o em duas fases - pré-preenchimento e decodificação - e tratando cada uma em pools separados de GPU.

Se comercializada, essa otimização provavelmente reduziria os custos dos servidores de inferência de IA e potencialmente aumentaria a demanda por semicondutores de servidor não-GPGPU e elementos de processamento especializado (SPE).

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Visualizar todos os comentários (0)0

Últimos comentários

Ibovespa

149.540,00

+760

+0,51%

Ibovespa Futuros

152.078,00

+738

+0,49%

US 500

6.841,90

+19,5

+0,29%

US 30

47.591,50

+69,7

+0,15%

S&P 500 VIX

17,44

+0,53

+3,13%

Bitcoin Futuro Futuros

110.320,00

+3.880,0

+3,65%

Índice Dólar

99,63

+0,280

+0,28%

Artigos mais populares

Notícias

Análises

Juro da dívida bate recorde e deficit nominal supera R$ 1 trilhão

Por Poder360

31 de out. de 2025

Ganhos de +148%: Nova lista de ações selecionadas por IA para novembro sai AMANHÃ

Por Investing.co...

31 de out. de 2025

JPMorgan aponta 5 diferenças cruciais entre o mercado atual e a bolha dos anos 1990

Por Investing.co...

31 de out. de 2025

Homens são mortos às centenas e somem no Sudão, dizem testemunhas

Por Reuters

01 de nov. de 2025

Azul chega acordo com credores não garantidos no processo de recuperação judicial

Por Reuters

01 de nov. de 2025

Mais notícias

Market Movers

Nome	Último	Var. %	Vol.
Gol PN	5,09	-2,12%	128,14M
Vale ON	65,26	+2,27%	38,95M
Bradesco PN	18,16	+0,33%	34,86M
Banco do Brasil ON	21,90	+1,25%	31,41M
Petrobras PN	29,75	-0,47%	29,42M
Itaú Unibanco PN	39,44	+0,38%	15,89M
Weg ON	42,10	+1,57%	12,52M

Nome	Último	Var. %	Vol.
Fiagro High	14,00	+36,99%	180,00
Illumina BDR	132,98	+23,70%	686,00
Fiset Pesca	0,320	+23,08%	11,00M
Suno Log FII	1,86	+21,57%	118,21K
Twilio BDR	29,46	+21,53%	1,48K
FII Brio Real Estate II	365,40	+17,45%	198,00
Nordon ON	5,15	+13,19%	1,90K

Nome	Último	Var. %	Vol.
Newell Brands BDR	18,51	-31,97%	7,63K
RDVC City	21,25	-14,93%	100,00
Dexcom BDR	6,31	-14,84%	9,05K
Ambipar ON	0,35	-12,50%	67,87M
Cedro Cachoeira ON	13,14	-12,46%	1,00K
Lumen BDR	52,90	-11,69%	26,78K
Marcopolo PN	7,89	-10,54%	65,13M

Ações em Destaque

Nome	Último	Var. %	Vol.
Vale ON	65,26	+2,27%	38,95M
Ambipar ON	0,35	-12,50%	67,87M
Petrobras PN	29,75	-0,47%	29,42M
Azul PN	1,14	+2,70%	12,56M
Banco do Brasil ON	21,90	+1,25%	31,41M

Exibir mais

Instale nossos aplicativosEscaneie o código QR para instalar os aplicativos

Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.

Pesquisas populares

Por favor, tente outra busca

Alibaba Cloud otimiza uso de GPU para inferência de LLM, reduzindo necessidade em 82%

Últimos comentários

Ações em Destaque