Fique por dentro das principais notícias do mercado desta segunda-feira
Investing.com - A inteligência artificial tornou-se uma parte cada vez mais comum do mundo moderno, com a tecnologia emergente começando a ser implementada em diversas profissões e indústrias.
Essa tendência impulsionou um aumento no entusiasmo em torno das potenciais aplicações da IA e provocou uma alta nas avaliações de empresas renomadas como a fabricante de semicondutores Nvidia (NASDAQ:NVDA) e o gigante de software Microsoft (NASDAQ:MSFT), vistas como líderes na corrida armamentista da IA. Esses ganhos, por sua vez, sustentaram o mercado de ações mais amplo, mesmo durante períodos recentes de maior incerteza econômica.
Mas ainda persistem dúvidas sobre a eficácia da IA e - potencialmente - sua capacidade de substituir tarefas tradicionalmente realizadas por humanos.
Em uma nota, analistas da Bernstein buscaram explorar essa questão desafiando modelos de IA a avaliar grandes volumes de dados e entregar análises financeiras de nível profissional.
O teste envolveu tanto modelos horizontais - ou de uso geral - de linguagem grande como o ChatGPT da OpenAI ou o Grok da xAI, quanto LLMs "verticais" mais específicos. O teste foi dividido em duas fases, uma focada em habilidades fundamentais como criação de gráficos e extração de dados, e a outra examinando se um modelo pode formular suas próprias opiniões e fazer julgamentos confiáveis sobre decisões gerenciais.
A primeira fase descobriu que muitas plataformas de IA tiveram problemas com mudanças de terminologia, como substituir "custos de pessoal" por "despesas com benefícios a funcionários". Embora tenham afirmado que a capacidade de criação de gráficos dos modelos era "robusta", a confiabilidade dos dados continuou sendo uma questão-chave, com apenas alguns modelos capazes de buscar números com precisão razoável.
Na segunda fase, os modelos demonstraram "notável proficiência" em tarefas cognitivamente mais complexas, como extrair as principais preocupações dos investidores de chamadas com a gerência ou criar uma linha do tempo de problemas em uma empresa. Alguns modelos foram até capazes de realizar efetivamente análises de tom em chamadas de resultados, "apontando onde a gerência parecia menos confiante ou evasiva", disseram eles.
"Os resultados foram notáveis e, dado o tempo de resposta para esse vasto conjunto de dados, ousamos dizer que superaram os humanos?", escreveram os analistas.
No entanto, eles afirmaram que a "euforia foi de curta duração", já que esse alto desempenho falhou "dramaticamente" quando introduziram o "elemento de cognição superior nas perguntas".
"Dada a vasta quantidade de informações que alimentamos nas plataformas, esperaríamos que um humano fosse razoavelmente bom em julgar tendências do setor, mas as plataformas de IA não foram eficazes em conectar fatores macro aparentemente desvinculados para prever padrões da indústria, a menos que explicitamente solicitadas", disseram. A IA, como um todo, não é um "cético natural", acrescentaram, e é "na melhor das hipóteses, uma ferramenta cognitiva".
"Sua eficácia? Tão boa quanto o humano que a utiliza", disseram os analistas da Bernstein.
Essa notícia foi traduzida com a ajuda de inteligência artificial. Para mais informação, veja nossos Termos de Uso.