Várias empresas de IA contornam padrão para extrair conteúdo de sites de mídia, diz empresa de licenciamento

Publicado 21.06.2024, 13:46

Atualizado 21.06.2024, 13:50

Por Katie Paul

(Reuters) - Várias empresas de inteligência artificial estão contornando um padrão comum da web usado por editoras para bloquear a extração de conteúdo de seus sites para uso em sistemas de inteligência artificial generativa, informou a startup de licenciamento de conteúdo TollBit às editoras.

A carta às editoras vista pela Reuters nesta sexta-feira, que não cita o nome das empresas de IA ou das editoras afetadas, surge em meio a uma disputa pública entre a startup de pesquisa de IA Perplexity e o veículo de mídia Forbes envolvendo o mesmo padrão da web e um debate mais amplo entre empresas de tecnologia e mídia sobre o valor do conteúdo na era da IA generativa.

A editora de mídia de negócios acusou publicamente a Perplexity de plagiar suas matérias investigativas em resumos gerados por IA sem citar a Forbes ou pedir sua permissão.

Uma investigação da Wired publicada esta semana descobriu que a Perplexity provavelmente contornou os esforços para bloquear seu rastreador de web por meio do Protocolo de Exclusão de Robôs, ou "robots.txt" -- um padrão amplamente aceito destinado a determinar quais partes de um site podem ser rastreadas.

A Perplexity recusou um pedido da Reuters para comentar a disputa.

A TollBit, uma startup em estágio inicial, está se posicionando como uma intermediária entre empresas de IA ávidas por conteúdo e editoras dispostas a fechar acordos de licenciamento com elas.

A empresa rastreia o tráfego de IA para os sites das editoras e usa análises para ajudar os dois lados a chegar a um acordo sobre as taxas a serem pagas pelo uso de diferentes tipos de conteúdo.

Por exemplo, as editoras podem optar por definir taxas mais altas para "conteúdo premium, como as últimas notícias ou insights exclusivos", diz a empresa em seu site.

A empresa diz que tinha 50 sites ativos em maio, embora não os tenha nomeado.

De acordo com a carta da TollBit, a Perplexity não é a única infratora que parece estar ignorando o "robots.txt".

A TollBit disse que suas análises indicam que "vários" agentes de IA estão ignorando o protocolo, uma ferramenta padrão usada pelas editoras para indicar quais partes do site podem ser rastreadas.

O protocolo "robots.txt" foi criado em meados da década de 1990 como uma forma de evitar a sobrecarga de sites com rastreadores da web. Embora não exista um mecanismo de aplicação legal, historicamente tem havido uma ampla conformidade na web.

Mais recentemente, o "robots.txt" se tornou uma ferramenta importante usada pelos editores para impedir que as empresas de tecnologia absorvam seu conteúdo gratuitamente para uso em sistemas de IA generativos que podem imitar a criatividade humana e resumir artigos instantaneamente.

As empresas de IA usam o conteúdo para treinar seus algoritmos e para gerar resumos de informações em tempo real.

Algumas editoras, incluindo o New York Times, processaram as empresas de IA por violação de direitos autorais em relação a esses usos. Outras estão assinando contratos de licenciamento com as empresas de IA abertas a pagar pelo conteúdo, embora as partes frequentemente discordem sobre o valor dos materiais. Muitos desenvolvedores de IA argumentam que não infringiram nenhuma lei ao acessá-los gratuitamente.

A Thomson Reuters, proprietária da Reuters News, está entre as que fecharam acordos para licenciar conteúdo de notícias para uso por modelos de IA.

Visualizar todos os comentários (0)0

Últimos comentários

Ibovespa

136.341,00

-15

-0,01%

Ibovespa Futuros

139.397,00

+107

+0,08%

US 500

6.446,80

-21,7

-0,34%

US 30

44.923,30

+12,0

+0,03%

S&P 500 VIX

15,09

+0,26

+1,75%

Bitcoin Futuro Futuros

117.235,00

-1.180,0

-1,00%

Índice Dólar

97,71

-0,390

-0,40%

Artigos mais populares

Notícias

Análises

BBAS3: Por que as ações do Banco do Brasil subiram hoje?

Por Investing.co...

16 de ago. de 2025

Eduardo Bolsonaro diz ter se reunido com secretário do Tesouro dos Estados Unidos

Por Reuters

15 de ago. de 2025

BBAS3: Como as ações do Banco do Brasil vão reagir após o balanço do 2º trimestre

Por Investing.co...

15 de ago. de 2025

Ibovespa fecha estável com resiliência do BB apesar de tombo no lucro

Por Reuters

15 de ago. de 2025

Dólar recua em linha com perdas no exterior após dados dos EUA

Por Reuters

15 de ago. de 2025

Mais notícias

Market Movers

Nome	Último	Var. %	Vol.
Gol PN	4,92	-5,38%	575,35M
Banco do Brasil ON	20,65	+4,03%	131,33M
Itaúsa PN	11,03	+0,09%	82,05M
Petrobras PN	30,17	-0,03%	54,89M
Vale ON	53,32	-0,19%	32,47M
Itaú Unibanco PN	37,49	-0,35%	16,99M
Embraer ON	77,29	-4,21%	8,64M

Nome	Último	Var. %	Vol.
Revee	30,00	+76,37%	4,40K
RDVC City	45,00	+25,00%	3,50K
SP Turismo PNA	58,00	+25,00%	5,00
Incyte BDR	230,20	+24,33%	1,20K
Minupar ON	33,16	+14,34%	12,90K
Inepar PN	1,57	+13,77%	20,50K
Universal Health Services BDR	241,44	+12,61%	7,07K

Nome	Último	Var. %	Vol.
Infracommerce ON	0,59	-14,49%	2,20M
Applied Materials BDR	88,04	-14,19%	13,01K
Light ON	6,10	-12,86%	3,00M
Cemepe PN	3,14	-10,29%	500,00
Cruzeiro do Sul ON	4,63	-10,10%	925,30K
Azevedo Travassos Energia	0,54	-10,00%	10,02M
Fiset Reflorestamento	0,100	-9,09%	19,00K

Ações em Destaque

Nome	Último	Var. %	Vol.
Banco do Brasil ON	20,65	+4,03%	131,33M
Azul PN	0,58	-4,92%	23,20M
Petrobras PN	30,17	-0,03%	54,89M
BB Seguridade ON	32,79	-1,77%	9,40M
IRB Brasil ON	47,03	+1,34%	2,46M

Exibir mais

Instale nossos aplicativosEscaneie o código QR para instalar os aplicativos

Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.

Pesquisas populares

Por favor, tente outra busca

Várias empresas de IA contornam padrão para extrair conteúdo de sites de mídia, diz empresa de licenciamento

Últimos comentários

Ações em Destaque