Especialistas em IA preparam “a última prova da humanidade” para surpreender tecnologia poderosa

Publicado 16.09.2024, 16:36

© Reuters. Ilustração mostra estatuetas com computadores e celulares em frente às palavras "IA Inteligência Artificial" n19/02/2024nREUTERS/Dado Ruvic

Por Jeffrey Dastin e Katie Paul

(Reuters) - Uma equipe de especialistas em tecnologia divulgou uma convocação global nesta segunda-feira buscando as questões mais complexas possíveis para serem perguntadas a sistemas de inteligência artificial (IA), que cada vez mais estão respondendo testes populares de referência como se fossem brincadeira de criança.

Com o nome de "A última prova da humanidade", o projeto busca determinar o momento da chegada da IA em nível especialista, dizem os organizadores do estudo, que fazem parte da organização sem fins lucrativos Centro de Segurança de IA (CAIS) e da empresa startup Scale AI.

A convocação ocorre dias após o criador do ChatGPT ter apresentado um novo modelo, conhecido como OpenAI o1, que “destruiu os benchmarks de raciocínio mais populares”, disse Dan Hendrycks, diretor-executivo do CAIS e consultor da startup xAI de Elon Musk.

Hendrycks foi coautor de dois artigos em 2021 que propuseram testes para sistemas de IA que agora são amplamente utilizados: um testando o conhecimento em nível de graduação no ensino superior sobre temas como história dos EUA e o outro avaliando a capacidade dos modelos de raciocínio matemático em nível das competições sobre a disciplina. O teste para nível de graduandos tem mais downloads no hub de IA online Hugging Face do que qualquer outro conjunto de dados similar.

Na época desses artigos, a IA dava respostas quase aleatórias às perguntas das provas. “Agora eles são facilmente respondidos”, Hendrycks disse à Reuters.

Por exemplo, os modelos Claude, do laboratório de IA Anthropic, atingiram uma pontuação de cerca de 77% no teste de nível graduandos em 2023 e chegaram a quase 89% um ano depois, de acordo com um importante ranking.

Como resultado, esses testes comuns de referência passam a ficar menos importantes.

A IA parece ter ido mal em testes menos conhecidos que envolvem formulação de planos e quebra-cabeças de reconhecimento de padrões visuais, de acordo com o Relatório de Índice de IA da Universidade de Stanford, divulgado em abril. O OpenAI o1 marcou cerca de 21% em uma versão do teste de reconhecimento de padrões ARC-AGI, por exemplo, disseram os organizadores do ARC na sexta-feira.

Alguns pesquisadores de IA argumentam que esse tipo de resultado mostra que o planejamento e o raciocínio abstrato são as melhores maneiras de medir inteligência, embora Hendrycks tenha dito que o aspecto visual do ARC o torna menos adequado para avaliar modelos de linguagem. “A Última Prova da Humanidade vai exigir raciocínio abstrato”, disse.

Respostas de testes de referências comuns também podem ter sido usadas para treinar os sistemas de IA, disseram especialistas de mercado. Hendrycks disse que algumas perguntas na 'Última Prova da Humanidade' permanecerão secretas para garantir que as respostas dos sistemas de IA não sejam apenas resultado de memorização de dados.

O exame incluirá pelo menos 1 mil perguntas feitas por pessoas até o dia 1º de novembro, em nível complexo para não especialistas responderem. Essas perguntas passarão por uma revisão por pares, e as submissões vencedoras terão coautoria e prêmios de até 5 mil dólares patrocinados pela Scale AI.

Só há, contudo, uma restrição: os organizadores não querem perguntas sobre armas, pois alguns dizem que seria muito perigoso para a IA estudar esse assunto.

Visualizar todos os comentários (1)1

Últimos comentários

Ibovespa

126.870,00

-1.328

-1,04%

Ibovespa Futuros

127.744,00

-1.364

-1,06%

US 500

5.944,70

+27,6

+0,47%

US 30

43.554,20

+145,7

+0,34%

S&P 500 VIX

15,87

-1,29

-7,52%

Bitcoin Futuro Futuros

97.872,50

+2.877,5

+3,03%

Índice Dólar

106,62

+0,004

0,00%

Artigos mais populares

Notícias

Análises

Dólar e Ibovespa hoje: o que esperar dos negócios na B3 nesta quinta

Por Investing.co...

21 de nov. de 2024

Petrobras (PETR4) paga hoje primeira parcela de remuneração a acionistas

Por Investing.co...

21 de nov. de 2024

Dólar sobe ante o real com aversão global ao risco e espera por pacote fiscal

Por Reuters

21 de nov. de 2024

Arrecadação federal cresce 9,77% em outubro e bate recorde para o mês, mostra Receita

Por Reuters

21 de nov. de 2024

Fique por dentro das principais notícias do mercado desta quinta-feira

Por Investing.co...

21 de nov. de 2024

Mais notícias

Market Movers

Nome	Último	Var. %	Vol.
B3 ON	9,84	-1,80%	8,67M
Bradesco PN	13,74	-0,58%	6,72M
Petrobras PN	37,80	0,00%	4,09M
Itaú Unibanco PN	34,24	-1,07%	2,72M
Vale ON	57,29	-0,68%	2,51M
BTG Pactual Unit	33,44	-2,02%	1,96M
Weg ON	53,59	-1,00%	1,91M

Nome	Último	Var. %	Vol.
Kingsoft Cloud BDR	6,35	+43,99%	5,88K
Microstrategy DRC	45,19	+25,91%	662,85K
Snowflake BDR	23,36	+25,19%	9,43K
Gol PN	1,64	+21,48%	12,09M
Wix.com BDR	40,60	+17,17%	468,00
Unity Software Inc BDR	6,35	+11,01%	37,11K
Datadog BDR	83,44	+9,96%	6,00

Nome	Último	Var. %	Vol.
Target BDR	709,80	-20,84%	268,00
Fiagro 051 Agro	110,01	-11,28%	21,00
Pinduoduo Inc BDR	61,07	-10,09%	1,93K
Americanas ON	8,07	-11,32%	3,19M
FII Projeto Água Branca	219,00	+0,01%	197,00
Vodafone BDR	23,21	-7,58%	234,00
GDS Holdings BDR	10,76	-7,56%	1,50K

Ações em Destaque

Nome	Último	Var. %	Vol.
Americanas ON	8,07	-11,32%	3,19M
Vale ON	57,29	-0,68%	2,51M
Oi ON	1,39	-0,71%	3,87M
Petrobras PN	37,80	0,00%	4,09M
Azul PN	4,86	-0,82%	4,92M

Exibir mais

Instale nossos aplicativosEscaneie o código QR para instalar os aplicativos

Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.

Pesquisas populares

Por favor, tente outra busca

Especialistas em IA preparam “a última prova da humanidade” para surpreender tecnologia poderosa

Últimos comentários

Ações em Destaque