DeepSeek tem baixa precisão em auditoria de IA, diz NewsGuard

Publicado 30.01.2025, 13:36
Atualizado 30.01.2025, 13:40
© Reuters.  DeepSeek tem baixa precisão em auditoria de IA, diz NewsGuard

Em avaliação realizada pela NewsGuard, o chatbot da startup chinesa DeepSeek registrou apenas 17% de precisão ao responder questões sobre notícias e informações gerais. A ferramenta ficou em 10º lugar entre 11 competidores, com desempenho inferior ao ChatGPT, da OpenAI, e ao Gemini, do Google (NASDAQ:GOOGL). As informações são da Reuters.

O resultado levanta dúvidas sobre a tecnologia de IA da DeepSeek, que alegava ter desempenho igual ou superior ao da OpenAI (apoiada pela Microsoft (NASDAQ:MSFT)) por uma fração do custo.

A auditoria mostrou que o chatbot da DeepSeek repetiu afirmações falsas em 30% das vezes e forneceu respostas vagas ou inúteis em 53% das ocasiões em resposta a prompts relacionados a notícias, resultando em uma taxa de falha de 83%. Esse desempenho é inferior à média de falha de 62% registrada pelos concorrentes ocidentais.

Nos dias que se seguiram ao seu lançamento, o chatbot da DeepSeek tornou-se o aplicativo mais baixado na App Store da Apple (NASDAQ:AAPL), gerando preocupações sobre a liderança dos Estados Unidos em IA e provocando uma queda no mercado que eliminou cerca de US$ 1 trilhão em ações de tecnologia americanas.

A NewsGuard aplicou os mesmos 300 prompts usados para avaliar os concorrentes ocidentais, incluindo 30 prompts baseados em 10 afirmações falsas que circulam online. Entre os tópicos avaliados estavam o assassinato do mês passado do executivo da UnitedHealthcare, Brian Thompson, e a queda do voo 8243 da Azerbaijan Airlines.

A auditoria também revelou que em 3 dos 10 prompts, o DeepSeek reiterou a posição do governo chinês sobre os tópicos sem que houvesse qualquer pergunta relacionada à China. Por exemplo, em prompts sobre a queda do avião da Azerbaijan Airlines—questões não relacionadas à China—o DeepSeek respondeu com a posição de Pequim sobre o assunto.

Assim como outros modelos de IA, o DeepSeek mostrou-se mais vulnerável a repetir alegações falsas ao responder a prompts usados por pessoas que buscam usar modelos de IA para criar e espalhar alegações falsas, acrescentou a NewsGuard.

A startup chinesa não respondeu imediatamente a um pedido de comentário.

Leia mais em Poder360

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2025 - Fusion Media Limited. Todos os direitos reservados.