IA vs humano: Bernstein sobre como usar LLMs?

Publicado 31.08.2025, 06:01
© Reuters.

Investing.com - A Bernstein publicou nova pesquisa sobre o uso de grandes modelos de linguagem (LLMs), avaliando onde a IA pode trabalhar independentemente e onde precisa de supervisão humana.

A corretora constatou que os sistemas de IA têm bom desempenho em tarefas como coleta e síntese de informações, mas ficam aquém em áreas que exigem julgamento crítico.

Os analistas afirmam que a pesquisa financeira difere de setores padronizados porque depende de "dados protegidos" proprietários e julgamento qualitativo.

Descobriu-se que os LLMs são eficazes em resumir teleconferências de resultados ao longo de cinco a seis anos e revisar relatórios extensos.

No entanto, quando solicitados a construir modelos de empresas ou teses de investimento, os sistemas de IA tiveram desempenho inferior.

Mesmo com instruções estruturadas, os resultados continham erros, valores codificados e faltava profundidade analítica.

A qualidade do prompt foi identificada como um fator crítico. Um estudo da Universidade do Sul da Califórnia mostrou que pequenas alterações nos prompts modificaram entre 5% e 9% das respostas.

Por exemplo, terminar uma pergunta com "Obrigado" alterou 5,6% dos resultados, enquanto reformular uma pergunta como uma afirmação mudou 8,5%.

Em pesquisas médicas, o GPT-4 produziu recomendações de tratamento alinhadas com diretrizes clínicas em 50,6% a 52,9% das vezes usando um método de "cadeia de pensamento", aumentando para 63% com prompts de recursão de pensamento.

Prompts estruturados melhoraram ainda mais a precisão diagnóstica, com a IA identificando casos de câncer metastático com uma pontuação F1 de 0,886, acima da média dos anotadores humanos de 0,838.

Os testes também mostraram que detalhes excessivos reduziram a precisão. O desempenho inicialmente melhorou com mais informações, mas diminuiu quando os prompts ficaram sobrecarregados, levando ao "inchaço de prompt".

A Bernstein testou novamente os LLMs em tarefas financeiras. No processamento de teleconferências de resultados, as pontuações médias aumentaram de 3,8 para 4,3 em 5 quando foi utilizado o prompt iterativo. O Perplexity subiu de 2 para 4,5, enquanto o ChatGPT melhorou de 3,5 para 4.

Para avaliar o tom da gestão, as pontuações médias aumentaram de 3,8 para 4 depois que os prompts adicionaram preocupações específicas dos investidores.

A análise mais ampla do setor melhorou de 3,2 para 3,9 com prompts mais elaborados. A construção de teses de investimento subiu apenas de 3 para 3,4, apesar de estruturas passo a passo bem definidas.

Na avaliação de decisões de gestão, as pontuações médias aumentaram de 3,5 para 4,1 quando fornecidos com um conjunto completo de parâmetros analíticos.

Tarefas padronizadas mostraram melhor desempenho da IA. Em testes de helpdesk de TI, sistemas de IA usando Geração Aumentada por Recuperação (RAG) pontuaram 29,4 em um benchmark SelfScore, comparado com humanos em 23,1. Mesmo sem técnicas de recuperação, agentes de IA superaram seus equivalentes humanos.

A Bernstein também acompanha o progresso da IA em diversas habilidades desde o final dos anos 1990. Os sistemas alcançaram ou superaram os níveis humanos em reconhecimento de escrita à mão, reconhecimento de imagem e reconhecimento de fala.

Ganhos também foram relatados em compreensão de leitura, codificação e resolução de problemas matemáticos, enquanto a interpretação nuançada da linguagem e o raciocínio complexo permanecem como pontos fortes humanos.

Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.