ArXiv ameaça banir cientistas que enviarem artigos com lixo gerado por IA
ArXiv ameaça banir cientistas que enviarem artigos com lixo gerado por IA
Repositório pressiona pesquisadores que usam IA para gerar textos inteiros (ilustração: Vitor Pádua/Tecnoblog)
Resumo
O ArXiv irá banir autores que enviarem artigos com texto gerado por IA sem revisão humana.
Autores serão afastados por um ano, caso a irregularidade seja constatada pela presidência da seção.
Após o período de um ano, novas submissões só serão aceitas se o artigo já tiver passado por uma publicação ou revisão por pares respeitável.
O ArXiv, um dos principais repositórios de artigos científicos do mundo, vai banir por um ano autores que submeterem trabalhos com sinais claros de texto gerado por IA sem revisão humana. Após o período, novas submissões só serão aceitas se o artigo já tiver passado por uma publicação ou revisão por pares considerada respeitável.
Na rede social X, o presidente da seção de ciência da computação do ArXiv, Thomas Dietterich, explicou que a medida mira artigos que reproduzem alucinações ou simplesmente esquecem parte da mensagem dos chatbots. A plataforma aplicará a punição quando houver evidências incontestáveis de que há texto gerado por LLMs publicado sem checagem.
Examples of incontrovertible evidence: hallucinated references, meta-comments from the LLM (“here is a 200 word summary; would you like me to make any changes?”; “the data in this table is illustrative, fill it in with the real numbers from your experiments”) end/— Thomas G. Dietterich (@tdietterich) May 14, 2026
Isso indica, por outro lado, que o ArXiv não está proibindo o uso de IA em qualquer etapa da pesquisa ou escrita. O alvo são trabalhos que chegam ao repositório com sinais óbvios de automação. Entre os exemplos, Dietterich cita referências bibliográficas inventadas e comentários do próprio chatbot deixados no corpo do artigo.
Ao 404 Media, o executivo afirmou que a regra vale já para a primeira infração de um autor. No entanto, a decisão passará por um processo interno, que exige que um moderador documente a irregularidade e a presidência da seção confirme o caso. Autores poderão recorrer.
O que é o ArXiv?
O ArXiv funciona como um repositório de preprints, ou seja, artigos disponibilizados antes da revisão por pares. Com isso, muitos autores conseguem acelerar a circulação de pesquisas em diversas áreas, mas essa mesma facilidade também tornou o repositório mais vulnerável a textos automatizados.
Como lembrar o 404 Media, em novembro do ano passado, a plataforma já havia deixado de aceitar artigos de ciência da computação, justamente por causa do aumento de materiais produzidos rapidamente com ajuda de LLMs.
Trecho invisível em um artigo no arXiv mostrava comando oculto para IAs (imagem: Kaori Yuzawa)
Em janeiro, ela também passou a exigir que autores estreantes recebam a recomendação de um pesquisador já estabelecido antes de realizar a primeira submissão.
As decisões foram tomadas meses após o jornal asiático The Nikkei denunciar que cientistas ao redor do mundo estavam publicando artigos científicos com prompts escondidos. A ação dos autores visava enganar ferramentas de IA que fossem usadas por revisores, induzindo-as a avaliar o conteúdo positivamente.
Na semana passada, um caso semelhante ocorreu no Brasil, desta vez no meio jurídico: duas advogadas do Pará foram multadas em R$ 84 mil após supostamente tentarem manipular uma ferramenta de IA usada pela Justiça do Trabalho. A estratégia envolvia ocultar um comando dentro da petição inicial para influenciar a interpretação do sistema.
Uso de IA alimenta mudanças no ArXiv
A preocupação vai além do ArXiv. Segundo o 404 Media, um estudo de pesquisadores da Universidade de Columbia analisou 2,5 milhões de artigos biomédicos ao longo de três anos e encontrou um aumento expressivo de referências fabricadas: foram uma a cada 458 publicações com esse problema em 2025.
Para se adaptar a esse novo cenário na produção científica, o ArXiv, hoje gerenciado pela Cornell, deve se tornar uma organização independente sem fins lucrativos em julho. A expectativa é que esse financiamento ajude a lidar com custos crescentes de moderação e com o avanço de submissões geradas por IA em larga escala.
ArXiv ameaça banir cientistas que enviarem artigos com lixo gerado por IA
ArXiv ameaça banir cientistas que enviarem artigos com lixo gerado por IA
Fonte: Tecnoblog
