Not All Citations Are Equal:Entropy-Guided Citation Selection for Noise-Resistant Medical LLM

Minyu Gao; Hanlin Xiao; Ruoyu Wang; Shuai Yang; YeXuan Zhang; Xin Wu; Xingyu Liu

Not All Citations Are Equal:Entropy-Guided Citation Selection for Noise-Resistant Medical LLM

Minyu Gao, Hanlin Xiao, Ruoyu Wang, Shuai Yang, YeXuan Zhang, Xin Wu, Xingyu Liu

Abstract

Retrieval-Augmented Generation (RAG) provides external knowledge support for large language models (LLMs) in medical applications, but retrieved contexts often contain noisy or conflicting evidence that can degrade reasoning. We observe that when internal and external knowledge disagree, models systematically prefer external citations, inadvertently injecting retrieval noise. Our analyses further show that only a subset of retrieved citations consistently improves outcomes; these effective citations exhibit markedly lower token-level entropy, linking citation entropy to model accuracy. Building on these findings, we propose a complete pipeline consisting of a training-free multi-turn reasoning framework and a post-training methodology. The training-free framework elicits internal thought, external thought, and fusion thought, and applies conflict detection and explicit denoising for complex queries. For post-training, we distill structured supervised fine-tuning (SFT) data and apply GRPO with an entropy-based citation reward that encourages selective citation of beneficial external knowledge while penalizing noisy citations. Experiments across diverse benchmarks demonstrate consistent gains in noise-resistant medical reasoning, with larger improvements on harder cases.

Anthology ID:: 2026.findings-acl.1727
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 34599–34615
Language:
URL:: https://aclanthology.org/2026.findings-acl.1727/
DOI:
Bibkey:
Cite (ACL):: Minyu Gao, Hanlin Xiao, Ruoyu Wang, Shuai Yang, YeXuan Zhang, Xin Wu, and Xingyu Liu. 2026. Not All Citations Are Equal:Entropy-Guided Citation Selection for Noise-Resistant Medical LLM. In Findings of the Association for Computational Linguistics: ACL 2026, pages 34599–34615, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Not All Citations Are Equal:Entropy-Guided Citation Selection for Noise-Resistant Medical LLM (Gao et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1727.pdf
Checklist:: 2026.findings-acl.1727.checklist.pdf

PDF Cite Search Checklist Fix data