Intel e Instituto Weizmann desenvolvem avanço que acelera modelos de IA

Publicado 16.07.2025, 12:42
© Reuters.

A Intel (NASDAQ:INTC) Labs e o Instituto Weizmann de Ciência desenvolveram um novo método que torna os grandes modelos de linguagem (LLMs) até 2,8 vezes mais rápidos sem sacrificar a qualidade do resultado, anunciou a empresa.

O avanço em "decodificação especulativa" foi apresentado na Conferência Internacional de Aprendizado de Máquina em Vancouver, Canadá. Esta técnica permite que qualquer modelo "rascunho" pequeno acelere qualquer modelo de linguagem grande, mesmo quando utilizam vocabulários diferentes.

"Resolvemos uma ineficiência central na IA generativa. Nossa pesquisa mostra como transformar a aceleração especulativa em uma ferramenta universal. Não é apenas uma melhoria teórica; são ferramentas práticas que já estão ajudando desenvolvedores a criar aplicações mais rápidas e inteligentes hoje", disse Oren Pereg, pesquisador sênior do Grupo de Processamento de Linguagem Natural da Intel Labs.

A decodificação especulativa funciona combinando um modelo pequeno e rápido com um maior e mais preciso. Quando recebe um comando como "Qual é a capital da França", um LLM tradicional gera cada palavra passo a passo, consumindo recursos significativos em cada etapa. Com a decodificação especulativa, o pequeno modelo assistente rapidamente elabora uma frase completa como "Paris, uma cidade famosa", que o modelo grande então verifica, reduzindo ciclos de computação.

O novo método remove limitações que anteriormente exigiam vocabulários compartilhados ou famílias de modelos co-treinados, tornando-o prático entre diferentes tipos de modelos. A técnica é agnóstica quanto ao fornecedor, funcionando com modelos de diferentes desenvolvedores e ecossistemas.

"Este trabalho remove uma grande barreira técnica para tornar a IA generativa mais rápida e mais barata", disse Nadav Timor, estudante de doutorado no grupo de pesquisa do Prof. David Harel no Instituto Weizmann. "Nossos algoritmos desbloqueiam acelerações de última geração que antes estavam disponíveis apenas para organizações que treinam seus próprios pequenos modelos de rascunho."

A pesquisa introduz três novos algoritmos que desvinculam a codificação especulativa do alinhamento de vocabulário. Esses algoritmos já foram integrados à biblioteca de código aberto Hugging Face Transformers, tornando a aceleração avançada de LLM disponível para milhões de desenvolvedores sem exigir código personalizado.

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.