Dados sintéticos e a revolução da IA na pesquisa com consumidores

Publicado 17.04.2025, 10:51

*Com André Fonseca

Imagine se fosse possível modelar no seu computador a psicologia, a cultura e o comportamento dos consumidores? Ou então, entrevistar milhares de consumidores, especialistas ou eleitores sem precisar entrar em contato com nenhuma dessas pessoas. Parece ficção científica? Pois esse futuro já chegou e atende pelo nome de dados sintéticos.

Dados sintéticos são informações geradas por algoritmos por meio de Large Language Models (LLMs), que são treinados para simular o comportamento, as opiniões e até os valores de grupos reais. Em vez de entrevistar um consumidor ou um especialista, treinamos o modelo para responder como eles responderiam. Isso é possível porque a inteligência artificial generativa cria modelos de mundo que são acessados para responder a qualquer pergunta sobre o mundo, simulando a psicologia, a cultura e o comportamento das pessoas. O resultado? Um ganho impressionante em escala, velocidade e custo.

Vamos a um exemplo concreto: suponha uma situação na qual você precisa avaliar a infraestrutura para inovação de um país. Tradicionalmente, essa pesquisa exige selecionar especialistas locais, contatá-los, aplicar questionários e compilar os dados — um processo caro e muitas vezes inviável, especialmente em países com poucos recursos. Com dados sintéticos, esse processo pode ser simulado com algoritmos treinados, que fornecem respostas altamente confiáveis em tempo real, com custo quase nulo.

Mas será que os resultados são mesmo confiáveis? Estudos têm mostrado que, em várias áreas, os dados sintéticos replicam com surpreendente precisão as respostas obtidas no mundo real. Pesquisas eleitorais, por exemplo, já foram simuladas com modelos que anteciparam com sucesso o comportamento do eleitorado. Mais recentemente, até pesquisas sobre moralidade — um tema profundamente subjetivo — foram reproduzidas com algoritmos, que conseguiram replicar a ordem de julgamento moral dada por seres humanos a diferentes comportamentos.

Esse avanço abre um leque de oportunidades extraordinárias. Empresas podem testar produtos com consumidores sintéticos antes de investir em pesquisas caras. A indústria audiovisual pode avaliar pilotos de séries, testar elencos e até prever a aceitação de narrativas. Instituições financeiras e governos podem tomar decisões com base em análises rápidas e amplas, com um custo muito menor do que as pesquisas tradicionais.

É importante destacar que o objetivo aqui não é substituir o ser humano. Dados sintéticos não eliminam a necessidade de contato com o consumidor real, mas oferecem um novo caminho para acessá-lo de maneira mais simples, rápida e escalável. Em muitos casos, são um primeiro passo que ajuda a filtrar ideias e hipóteses antes de ir a campo.

Uma outra possibilidade que temos testado em nosso grupo de pesquisas no Coppead é trabalhar na fronteira entre pesquisa qualitativa e quantitativa. Por exemplo, o algoritmo pode ser treinado para transformar dados desestruturados (de uma conversa ou de uma entrevista qualitativa por exemplo) em escalas típicas de pesquisas quantitativas, já estruturadas. Como a maior parte dos dados produzidos no mundo é desestruturado, essa solução não apenas desconstrói as barreiras e limitações históricas das abordagens de pesquisa qualitativa e quantitativa, como também permite utilizar com eficiência dados para tomar decisões mais bem fundamentadas.

Qual seria o efeito do valuation das empresas da adoção de uma tecnologia como essa? Uma empresa de mídia, por exemplo, poderia manter dentro de casa uma réplica perfeita de cada segmento da audiência. Decisões relacionadas ao elenco poderiam ser tomadas consultando uma ou mais dessas réplicas: “Você que é uma mulher de classe média alta residente na Zona Sul do Rio de Janeiro, responde para mim de forma direta: ator A ou ator B para o papel X; quem te transmite mais emoção?”. Imagine o efeito dessa possibilidade de obtenção sintética, com um elevado grau de verossimilhança, da opinião do seu telespectador ou cliente. Aquele elemento que sempre foi exógeno à execução de qualquer plano de negócios, no sentido de que a gestão da empresa tem pouco controle sobre ele, passa agora a ser endógeno porque as decisões de investimento em IA, caso corretas e suficientes, permitirão que a empresa saiba, a cada momento do tempo, o que os consumidores pensam. Essa capacidade, no nosso entendimento, poderia reduzir a taxa de desconto usada no cálculo dos valuations das empresas que melhor se valerem da IA Aplicada porque diminui muito os riscos de execução do negócio. 

Estamos vivendo uma revolução silenciosa nos bastidores da análise de dados. E, para quem investe, essa transformação pode representar uma vantagem competitiva importante: acesso a informações mais rápidas, precisas e baratas para fundamentar uma tomada de decisão melhor em um ambiente cada vez mais complexo.

* Professor e coordenador do Centro de Estudos em Estratégia e Inovação do COPPEAD/UFRJ

Últimos comentários

Carregando o próximo artigo...
Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.