Ter. Mai 26th, 2026

As citações ilusórias em artigos científicos aumentaram dramaticamente desde o surgimento das ferramentas de IA. Pelo menos 1.46.932 referências fabricadas geradas por inteligência artificial entraram no registro científico até 2025, com a maioria daquelas encontradas em preprints sobrevivendo à revisão por pares e transformando-se em artigos de periódicos, informou o TOI.

Essa é a principal conclusão de um estudo em grande escala no qual pesquisadores da Universidade Cornell, da Universidade da Califórnia, em Los Angeles, e da Universidade da Califórnia, em Berkeley, analisaram 111 milhões de citações em 2,5 milhões de artigos de pesquisa publicados em arXiv, bioRxiv, SSRN e PubMM entre 2020 e 2025.

O estudo, intitulado “LLM Hallucinations in the Wild”, rastreou citações não verificáveis ​​de grandes bancos de dados acadêmicos, como Semantic Scholar, OpenAlex e Google Scholar. Ao comparar as tendências pós-2022 com as linhas de base de erro pré-ChatGPT, os pesquisadores isolaram o papel das alucinações geradas pela IA no aumento acentuado, relatou o TOI.

As descobertas foram impressionantes. Em agosto de 2025, as taxas de citações falsas aumentaram para cerca de 2% em artigos SSRN, 0,4% no arXiv, 0,3% no PubMed Central e 0,2% no bioRxiv, com contagens mensais de citações falsas atingindo 8.140 apenas no PubMed Central.

O aumento acentuado começou em meados de 2024, cerca de 18 meses após o lançamento público do ChatGPT, à medida que as ferramentas de IA evoluíram de assistentes de redação para mecanismos de geração de citações, informou o TOI.


Os pesquisadores observaram que a contaminação não se limitou a documentos claramente fraudulentos. Em vez disso, as referências falsas são frequentemente distribuídas de forma esparsa em manuscritos legítimos, sugerindo que muitos investigadores podem simplesmente copiar citações geradas por IA sem verificá-las adequadamente.

O problema parecia afetar desproporcionalmente certos grupos. Os autores associados a citações ilusórias eram geralmente menos experientes, mas a produção de suas publicações cresceu rapidamente – aumentando 3,13 vezes mais rápido no SSRN e dobrando no bioRxiv até 2025 em comparação com pares correspondentes. Quando referências ilusórias apontavam para cientistas reais, favoreciam estudiosos de destaque – 68,8% mais publicações anteriores e 58,3% mais citações do que a média entre os citados.

As salvaguardas existentes foram consideradas inadequadas. Cerca de 78,8% das citações falsas passaram pela moderação do arXiv e nos preprints do BioArchive posteriormente publicados em periódicos indexados no PubMed Central, 85,3% das referências alucinadas permaneceram nas edições finais publicadas.

O problema pode ser auto-reforçado, alertaram os pesquisadores. À medida que as referências fabricadas são incorporadas em repositórios de acesso aberto e bancos de dados de citações, futuros modelos de IA treinados nesses conjuntos de dados podem absorver e reproduzir a mesma paranóia.

Um estudo publicado na The Lancet também levanta preocupações

Num estudo separado intitulado “Citações fabricadas: uma auditoria em 2,5 milhões de artigos biomédicos”, publicado no The Lancet, os investigadores relataram um aumento significativo nas citações fabricadas em artigos de investigação biomédica.

O estudo, conduzido por pesquisadores da Universidade de Columbia e de outras instituições, analisou artigos biomédicos publicados entre 2023 e o início de 2026. Identificou mais de 4.000 referências artificiais incorporadas em 2.810 artigos revisados ​​por pares.

A auditoria constatou que a taxa de referências fabricadas aumentou acentuadamente ao longo de um período de três anos. Em 2023, aproximadamente um em cada 2.828 artigos continha pelo menos uma citação fabricada. Em 2025, este número caiu para um em 458 artigos e, no início de 2026, aumentou para um em 277 artigos.

Um dos exemplos mais notáveis ​​destacados no estudo é um artigo de 2025 sobre técnicas cirúrgicas ureterais publicado em uma revista de oncologia de acesso aberto. Os pesquisadores descobriram que 18 das 30 referências verificadas no artigo – ou 60% – foram fabricadas.

Os autores atribuíram o aumento em parte à adoção generalizada de grandes modelos de linguagem (LLMs), conhecidos por “disfarçar” citações falsas.

Os investigadores, que alertaram que as citações fabricadas poderiam comprometer as directrizes clínicas e as revisões sistemáticas, instaram os editores a introduzir sistemas automatizados de verificação de referências antes de aceitarem artigos para publicação. O estudo também observou que 98% dos artigos afetados não enfrentaram nenhuma ação dos editores durante a auditoria.

Fonte da notícia

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *