NVDA disparou 197% desde a entrada na estratégia de IA em Novembro - é hora de vender? 🤔Saiba mais

Autores dizem que Meta usou livros protegidos por direito autoral em treinamento de IA

Publicado 13.12.2023, 10:15
© Reuters. REUTERS/Dado Ruvic
META
-
M1TA34
-

Por Katie Paul

NOVA YORK (Reuters) - Os advogados da Meta (NASDAQ:META) alertaram a empresa sobre os riscos legais de a empresa usar milhares de livros para treinar seus modelos de IA, mas ela fez isso mesmo assim, de acordo com um novo processo que acusa a companhia de violação de direitos autorais.

O novo processo, apresentado na noite de segunda-feira, consolida duas ações judiciais movidas contra a proprietária do Facebook e do Instagram pela comediante Sarah Silverman, pelo ganhador do Prêmio Pulitzer Michael Chabon e por outros autores proeminentes, que alegam que a Meta usou suas obras sem permissão para treinar seu modelo de linguagem de inteligência artificial, o Llama.

No mês passado, um juiz da Califórnia indeferiu parte do processo de Silverman e indicou que daria aos autores permissão para alterar suas reivindicações.

A Meta não respondeu imediatamente a um pedido de comentário sobre as alegações.

A nova queixa, apresentada na segunda-feira, inclui registros de bate-papo de um pesquisador afiliado à Meta discutindo a aquisição do conjunto de dados em um servidor Discord, uma evidência potencialmente significativa que indica que a Meta estava ciente de que o uso dos livros poderia não estar protegido pela lei de direitos autorais dos EUA.

Nos registros de bate-papo citados na denúncia, o pesquisador Tim Dettmers descreve suas conversas com o departamento jurídico da Meta sobre se o uso dos arquivos de livros como dados de treinamento seria "legalmente aceitável".

"No Facebook, há muitas pessoas interessadas em trabalhar com o (T)he (P)ile, inclusive eu, mas em sua forma atual, não podemos usá-lo por motivos legais", escreveu Dettmers em 2021, referindo-se a um conjunto de dados que a Meta reconheceu ter usado para treinar sua primeira versão do Llama, de acordo com a denúncia.

No mês anterior, Dettmers escreveu que os advogados da Meta haviam lhe dito que "os dados não podem ser usados ou os modelos não podem ser publicados se forem treinados com esses dados", diz a denúncia.

Embora Dettmers não descreva as preocupações dos advogados, seus pares no chat identificam "livros com direitos autorais ativos" como a maior fonte provável de preocupação. Eles dizem que o treinamento com os dados deve "se enquadrar no uso justo", uma doutrina jurídica dos EUA que protege determinados usos não licenciados de obras com direitos autorais.

Dettmers, um estudante de doutorado da Universidade de Washington, disse à Reuters que não poderia comentar sobre as alegações.

Este ano, as empresas de tecnologia têm enfrentado uma série de ações judiciais de criadores de conteúdo que as acusam de roubar obras protegidas por direitos autorais para criarem modelos de IA generativos.

Se forem bem-sucedidos, esses casos poderão frear o desenvolvimento de IA generativa, pois poderão aumentar o custo da criação de modelos que consomem muitos dados, obrigando as empresas de IA a compensarem artistas, autores e outros criadores de conteúdo pelo uso de suas obras.

Ao mesmo tempo, novas regras provisórias na Europa que regulamentam a inteligência artificial podem forçar as empresas a divulgarem dados que usam para treinar seus modelos, expondo-as potencialmente a mais riscos legais.

© Reuters. REUTERS/Dado Ruvic

A Meta lançou uma primeira versão de seu modelo de linguagem ampla Llama em fevereiro e publicou uma lista de conjuntos de dados usados para treinamento, incluindo "a seção Books3 do ThePile". A pessoa que montou esse conjunto de dados disse em outro fórum que ele contém 196.640 livros, de acordo com a denúncia.

A empresa não divulgou os dados de treinamento da versão mais recente do modelo, o Llama 2, que disponibilizou para uso comercial em meados deste ano.

O Llama 2 é de uso gratuito para empresas com menos de 700 milhões de usuários ativos mensais. O lançamento foi visto no setor de tecnologia como um potencial divisor de águas no mercado de software de IA generativa, ameaçando derrubar o domínio de participantes como a OpenAI e o Google (NASDAQ:GOOGL), que cobram pelo uso de seus modelos.

Últimos comentários

Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2024 - Fusion Media Limited. Todos os direitos reservados.