Como o escalonamento pós-treinamento está oferecendo ganhos em inteligência artificial

AutorPratyush Thakur

Ações

Publicado 26.07.2025, 06:00

Visualizar todos os comentários (0)0

Investing.com - A corrida da IA está entrando em uma nova fase, com uma mudança acentuada do escalonamento por força bruta de dados de treinamento para a amplificação estratégica de modelos após o treinamento.

Divulgações recentes sobre o modelo Grok 4 da xAI mostram uma mudança estrutural na forma como os ganhos de inteligência estão sendo desbloqueados, não pelo aumento do tamanho do modelo ou pela alimentação de mais dados, mas pelo investimento pesado em computação pós-treinamento.

Até o final de 2024, a maioria dos avanços em IA foi impulsionada pelas leis de escalonamento "Chinchilla" — treinando modelos cada vez maiores em conjuntos de dados cada vez maiores.

Isso mudou com o modelo o1 da OpenAI e agora está sendo acelerado pelo Grok 4, segundo o Barclays (LON:BARC).

O modelo Grok 4 usa aproximadamente a mesma computação de pré-treinamento que seu antecessor, mas alcança níveis de inteligência marcadamente mais altos graças a um aumento de dez vezes no aprendizado por reforço aplicado após a fase inicial de treinamento.

Diferentemente do pré-treinamento, que depende do aprendizado não supervisionado de vastos corpora de texto, o pós-treinamento através do aprendizado por reforço permite que os modelos melhorem por meio de tentativa e erro usando tarefas selecionadas.

No caso do Grok 4, essa mudança não apenas melhorou o raciocínio e a resolução de problemas, mas o fez sem aumentar o número de parâmetros do modelo, mantendo os custos de inferência mais baixos enquanto aumentava a qualidade da saída.

As implicações são significativas. "Não deveria haver tanta dependência do aumento de tokens brutos de dados de pré-treinamento para alcançar maior desempenho e inteligência", disse o analista do Barclays.

Em vez disso, a tendência é em direção a modelos agênticos que podem planejar, raciocinar e interagir com ferramentas em ambientes complexos. Um benchmark mostra o Grok 4 superando outros modelos líderes e humanos na gestão de um negócio simulado de máquinas de venda automática, um teste de raciocínio econômico e adaptabilidade.

Essa evolução tem ramificações claras para a demanda de computação e despesas de capital.

Enquanto modelos anteriores geravam respostas em etapas únicas, modelos agênticos agora raciocinam em cadeias, emitindo tokens 15 vezes mais intensivos em computação por consulta.

Como tal, o pós-treinamento pode não ser apenas o caminho para modelos mais inteligentes, mas também pode justificar os impressionantes investimentos em infraestrutura sendo feitos pelos hiperescaladores.

Em um campo há muito definido pela escala de pré-treinamento, o pós-treinamento pode ser onde reside a verdadeira inteligência.

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Visualizar todos os comentários (0)0

Últimos comentários

Ibovespa

134.666,00

+234

+0,17%

Ibovespa Futuros

137.264,00

+370

+0,27%

US 500

6.387,80

-8,0

-0,12%

US 30

44.873,00

-65,1

-0,14%

S&P 500 VIX

15,69

+0,12

+0,77%

Bitcoin Futuro Futuros

114.430,00

-125,0

-0,11%

Índice Dólar

98,142

+0,032

+0,03%

Artigos mais populares

Notícias

Análises

BBAS3: Saiba como usar análise SWOT para investir, ou não, em Banco do Brasil

Por Investing.co...

21 de ago. de 2025

EXCLUSIVO-Moraes diz que bancos podem ser punidos se aplicarem sanções dos EUA a ativos brasileiros

Por Reuters

20 de ago. de 2025

Presidente do BB diz que banco segue legislação do Brasil e de países onde atua

Por Reuters

20 de ago. de 2025

EXCLUSIVO-Moraes diz esperar que Trump revogue sanções contra ele

Por Reuters

20 de ago. de 2025

Quais setores cairão se o Fed surpreender com tom hawkish em Jackson Hole?

Por Investing.co...

21 de ago. de 2025

Mais notícias

Market Movers

Nome	Último	Var. %	Vol.
Gol PN	4,40	-6,78%	306,47M
B3 ON	12,33	-1,60%	45,12M
Banco do Brasil ON	19,86	+0,30%	38,28M
Petrobras PN	30,22	+0,60%	23,65M
Itaú Unibanco PN	36,33	+0,06%	16,35M
Vale ON	53,00	-0,45%	9,66M
Embraer ON	76,10	-1,17%	8,33M

Nome	Último	Var. %	Vol.
FICA ON	21,63	+13,84%	100,00
Viveo ON	0,94	+13,25%	2,36M
Coelce ON	36,00	+12,50%	100,00
Cigna Corp BDR	416,00	+11,65%	2,00
BRB PN	11,12	+11,20%	29,10K
Simpar ON	4,49	+10,05%	12,16M
Alliança ON	5,67	+9,04%	187,90K

Nome	Último	Var. %	Vol.
General Shopping ON	3,06	-31,85%	68,00K
Revee	21,00	-24,92%	6,90K
FII Grupo RCFA	0,82	-18,00%	1,00
Plascar Participações ON	4,33	-13,57%	800,00
Santanense ON	2,62	-12,37%	1,40K
Cedro PN	11,20	-12,16%	1,70K
Oncoclinicas ON	4,39	-11,85%	3,42M

Ações em Destaque

Nome	Último	Var. %	Vol.
Banco do Brasil ON	19,86	+0,30%	38,28M
Petrobras PN	30,22	+0,60%	23,65M
Raizen PN	1,03	-0,96%	18,28M
Azul PN	0,55	-1,79%	8,48M
BB Seguridade ON	31,92	-0,93%	6,48M

Exibir mais

Instale nossos aplicativosEscaneie o código QR para instalar os aplicativos

Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.

Pesquisas populares

Por favor, tente outra busca

Como o escalonamento pós-treinamento está oferecendo ganhos em inteligência artificial

Últimos comentários

Ações em Destaque