Escritores acusam Nvidia de acessar 500 TB de livros pirateados

Escritores acusam Nvidia de acessar 500 TB de livros pirateados

Empresa de chips recorreu a arquivos piratas do Anna’s Archive (ilustração: Vitor Pádua/Tecnoblog)

Resumo

A Nvidia é acusada de usar 500 TB de livros pirateados do site Anna’s Archive para treinar IA, ignorando alertas sobre ilegalidade.
Emails internos indicam que a gerência da Nvidia autorizou o download de obras protegidas, visando competir com o ChatGPT.
Um grupo de escritores processa a Nvidia por uso não autorizado de suas obras, enquanto a empresa alega “uso justo” no treinamento de IA.

A Nvidia teria autorizado o download massivo de livros pirateados do site Anna’s Archive para treinar modelos de inteligência artificial, de acordo com acusação de um grupo de escritores dos Estados Unidos. As novas evidências foram anexadas na última sexta-feira (16/01) a um processo que tramita no Tribunal Distrital do Norte da Califórnia.

Segundo a acusação, a gigante dos chips teria contatado diretamente os administradores da plataforma e deu prosseguimento à coleta de dados em menos de uma semana, ignorando um alerta do próprio site sobre a natureza irregular do acervo.

A denúncia, analisada pelo portal Torrent Freak, aponta que a decisão de usar material protegido foi uma estratégia deliberada impulsionada pela “pressão competitiva” para rivalizar com o ChatGPT, da OpenAI, e lançar modelos proprietários (como o NeMo e Megatron) no mercado.

Trecho do processo indica que a competição em IA levou a Nvidia à pirataria (imagem: reprodução/Torrent Freak)

Empresa foi avisada sobre pirataria

A acusação baseia-se em trocas de emails de 2023, obtidas durante a fase de coleta de evidências do processo. Os documentos mostram que um membro da equipe de estratégia de dados da Nvidia entrou em contato com o Anna’s Archive para negociar “acesso de alta velocidade” ao banco de dados, visando alimentar o que a empresa chamava internamente de “NextLargeLLM”.

De acordo com o processo, os operadores do Anna’s Archive alertaram que a coleção era adquirida ilegalmente e questionaram se a Nvidia tinha permissão interna para assumir o risco.

O site teria oferecido acesso a cerca de 500 terabytes de dados, incluindo milhões de livros que, legalmente, estariam disponíveis apenas em sistemas de empréstimo digital restritos. Ainda assim, o documento afirma que a Nvidia “deu sinal verde” para prosseguir com a pirataria.

Anna’s Archive avisou empresa sobre natureza dos dados (imagem: reprodução/Torrent Freak)

Quem está processando?

A ação coletiva é movida por um grupo de escritores que representam uma classe de autores cujas obras teriam sido utilizadas sem consentimento ou pagamento. Eles buscam compensação.

A nova versão da queixa expande o escopo do processo original. Além do Anna’s Archive, os autores alegam que a Nvidia utilizou outras fontes notórias de pirataria acadêmica e literária, como Bibliotik (através do dataset Books3), LibGen, Sci-Hub e Z-Library.

A defesa da Nvidia argumentou, em fases anteriores do processo, que a utilização de livros para treinamento de IA constitui “uso justo” (fair use), alegando que as obras são apenas correlações estatísticas para os modelos de IA.

Agora, os autores adicionaram acusações de infração direta e vicária de direitos autorais.

Em junho de 2025, a Anthropic venceu um processo também movido por um grupo de autores que acusava a empresa de usar obras protegidas no treinamento da IA Claude. A Justiça, à época, reconheceu o uso justo de livros comprados pela empresa, mas ordenou um outro processo para julgar as cópias pirateadas. A Anthropic optou por encerrar a disputa por meio de um acordo de US$ 1,5 bilhão (cerca R$ 8 bilhões) com autores e editoras.
Escritores acusam Nvidia de acessar 500 TB de livros pirateados

Escritores acusam Nvidia de acessar 500 TB de livros pirateados
Fonte: Tecnoblog