Reddit processa Perplexity por roubo de dados para IA

23 de outubro de 2025

Governo e Legislação, Inteligência Artificial (IA), Perplexity.ai, RedditComentários desativados

Reddit processa Perplexity por roubo de dados para IA

Reddit acusa Perplexity de roubo de dados (imagem: Brett Jordan/Unsplash)

Resumo

Reddit processou a Perplexity e outras três empresas por suposto roubo de dados e violação de direitos autorais e termos de serviço.
Um post “fantasma” criado pelo Reddit apareceu na Perplexity, servindo como prova de uso indevido de conteúdo.
A empresa pede indenização e proibição permanente do uso de seus dados pelas rés.

O Reddit abriu um processo judicial contra a conhecida startup de inteligência artificial Perplexity por suposto roubo de dados em escala industrial. Além dela, a ação também mira a SerpApi, a Oxylabs e a AWMProxy – as duas últimas são da Lituânia e da Rússia.

Segundo a acusação, detalhada pelo The New Tork Times, essas três empresas operaram coletando ilegalmente dados do Reddit não diretamente, mas ao extrair o conteúdo dos resultados de busca do Google. Esse material seria revendido para alimentar modelos de IA de empresas como a Perplexity.

A alegação é de que as empresas violaram as leis de direitos autorais e os termos de serviço da plataforma ao praticar a raspagem de dados (data scraping) sem autorização.

Reddit criou armadilha

Para provar a violação, o Reddit preparou um post de teste “fantasma”, visível apenas para os robôs de indexação do Google e inacessível de qualquer outra forma. Em poucas horas, o conteúdo desse post teria aparecido nos resultados de busca da Perplexity.

Segundo a ação, essa é a prova de que a startup de IA está usando o Google como um atalho para acessar e exibir o conteúdo do Reddit sem permissão.

O processo alega ainda que o Reddit já havia enviado uma notificação formal para a Perplexity no passado, exigindo que a startup parasse a raspagem dos dados. A companhia teria concordado, mas o Reddit afirma que as citações ao seu conteúdo na ferramenta de IA “saltaram quarenta vezes” desde então.

Em comunicado enviado à Bloomberg, o diretor jurídico do Reddit, Ben Lee, afirma que as empresas de IA “estão presas a uma corrida armamentista por conteúdo humano de qualidade”, e que essa pressão “alimentou uma economia de ‘lavagem de dados’ em escala industrial.”

Vale lembrar que essa não é a primeira vez que a Perplexity é envolvida em polêmica sobre uso indevido de dados. Em agosto desse ano, a Cloudflare acusou a companhia de ignorar instruções do arquivo robots.txt e extrair ilegalmente o conteúdo de sites. Em 2024, a Amazon teve que intervir após acusações de que a startup estaria usando os servidores dela para plagiar matérias de veículos como Wired e Forbes.

Reddit quer indenização

Processo pede por indenização e proibição permanente de uso dos dados (imagem: reprodução/Shutterstock)

O Reddit, que já possui acordos de licenciamento milionários com o Google e a OpenAI, pede à Justiça uma indenização financeira e uma ordem judicial que proíba permanentemente as empresas de usarem seus dados.

Procurada pela imprensa, a Perplexity afirmou que ainda não havia recebido o processo, mas que “sempre lutará vigorosamente pelos direitos dos usuários de acessar livremente o conhecimento público”. O Reddit também processou a Anthropic, outra gigante da IA, em junho por motivos semelhantes.

O Google, que não está sendo processado, afirmou ao NYT que respeita as diretrizes de sites, mas que, “infelizmente, há um monte de scrapers furtivos que não o fazem”. As outras duas empresas processadas, SerpApi e Oxylabs, não responderam aos pedidos de comentário da imprensa norte-americana, enquanto a AWMProxy, sediada na Rússia, não foi localizada.

Reddit processa Perplexity por roubo de dados para IA

Reddit processa Perplexity por roubo de dados para IA
Fonte: Tecnoblog

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Reddit processa Perplexity por roubo de dados para IA

Tags:

Share this post: