Reddit processa Perplexity por roubo de dados para IA
Reddit processa Perplexity por roubo de dados para IA
Reddit acusa Perplexity de roubo de dados (imagem: Brett Jordan/Unsplash)
Resumo
Reddit processou a Perplexity e outras três empresas por suposto roubo de dados e violação de direitos autorais e termos de serviço.
Um post “fantasma” criado pelo Reddit apareceu na Perplexity, servindo como prova de uso indevido de conteúdo.
A empresa pede indenização e proibição permanente do uso de seus dados pelas rés.
O Reddit abriu um processo judicial contra a conhecida startup de inteligência artificial Perplexity por suposto roubo de dados em escala industrial. Além dela, a ação também mira a SerpApi, a Oxylabs e a AWMProxy – as duas últimas são da Lituânia e da Rússia.
Segundo a acusação, detalhada pelo The New Tork Times, essas três empresas operaram coletando ilegalmente dados do Reddit não diretamente, mas ao extrair o conteúdo dos resultados de busca do Google. Esse material seria revendido para alimentar modelos de IA de empresas como a Perplexity.
A alegação é de que as empresas violaram as leis de direitos autorais e os termos de serviço da plataforma ao praticar a raspagem de dados (data scraping) sem autorização.
Reddit criou armadilha
Para provar a violação, o Reddit preparou um post de teste “fantasma”, visível apenas para os robôs de indexação do Google e inacessível de qualquer outra forma. Em poucas horas, o conteúdo desse post teria aparecido nos resultados de busca da Perplexity.
Segundo a ação, essa é a prova de que a startup de IA está usando o Google como um atalho para acessar e exibir o conteúdo do Reddit sem permissão.
O processo alega ainda que o Reddit já havia enviado uma notificação formal para a Perplexity no passado, exigindo que a startup parasse a raspagem dos dados. A companhia teria concordado, mas o Reddit afirma que as citações ao seu conteúdo na ferramenta de IA “saltaram quarenta vezes” desde então.
Em comunicado enviado à Bloomberg, o diretor jurídico do Reddit, Ben Lee, afirma que as empresas de IA “estão presas a uma corrida armamentista por conteúdo humano de qualidade”, e que essa pressão “alimentou uma economia de ‘lavagem de dados’ em escala industrial.”
Vale lembrar que essa não é a primeira vez que a Perplexity é envolvida em polêmica sobre uso indevido de dados. Em agosto desse ano, a Cloudflare acusou a companhia de ignorar instruções do arquivo robots.txt e extrair ilegalmente o conteúdo de sites. Em 2024, a Amazon teve que intervir após acusações de que a startup estaria usando os servidores dela para plagiar matérias de veículos como Wired e Forbes.
Reddit quer indenização
Processo pede por indenização e proibição permanente de uso dos dados (imagem: reprodução/Shutterstock)
O Reddit, que já possui acordos de licenciamento milionários com o Google e a OpenAI, pede à Justiça uma indenização financeira e uma ordem judicial que proíba permanentemente as empresas de usarem seus dados.
Procurada pela imprensa, a Perplexity afirmou que ainda não havia recebido o processo, mas que “sempre lutará vigorosamente pelos direitos dos usuários de acessar livremente o conhecimento público”. O Reddit também processou a Anthropic, outra gigante da IA, em junho por motivos semelhantes.
O Google, que não está sendo processado, afirmou ao NYT que respeita as diretrizes de sites, mas que, “infelizmente, há um monte de scrapers furtivos que não o fazem”. As outras duas empresas processadas, SerpApi e Oxylabs, não responderam aos pedidos de comentário da imprensa norte-americana, enquanto a AWMProxy, sediada na Rússia, não foi localizada.
Reddit processa Perplexity por roubo de dados para IA
Reddit processa Perplexity por roubo de dados para IA
Fonte: Tecnoblog

Comments are closed.