A Survey on Proactive Defense Strategies Against Misinformation in Large Language Models

Shuliang Liu; Hongyi Liu; Aiwei Liu; Duan Bingchen; Zheng Qi; Yibo Yan; He Geng; Peijie Jiang; Jia Liu; Xuming Hu

doi:10.18653/v1/2025.findings-acl.933

A Survey on Proactive Defense Strategies Against Misinformation in Large Language Models

Shuliang Liu, Hongyi Liu, Aiwei Liu, Duan Bingchen, Zheng Qi, Yibo Yan, He Geng, Peijie Jiang, Jia Liu, Xuming Hu

Abstract

The widespread deployment of large language models (LLMs) across critical domains has amplified the societal risks posed by algorithmically generated misinformation. Unlike traditional false content, LLM-generated misinformation can be self-reinforcing, highly plausible, and capable of rapid propagation across multiple languages, which traditional detection methods fail to mitigate effectively. This paper introduces a proactive defense paradigm, shifting from passive post hoc detection to anticipatory mitigation strategies. We propose a Three Pillars framework: (1) Knowledge Credibility, fortifying the integrity of training and deployed data; (2) Inference Reliability, embedding self-corrective mechanisms during reasoning; and (3) Input Robustness, enhancing the resilience of model interfaces against adversarial attacks. Through a comprehensive survey of existing techniques and a comparative meta-analysis, we demonstrate that proactive defense strategies offer up to 63% improvement over conventional methods in misinformation prevention, despite non-trivial computational overhead and generalization challenges. We argue that future research should focus on co-designing robust knowledge foundations, reasoning certification, and attack-resistant interfaces to ensure LLMs can effectively counter misinformation across varied domains.

Anthology ID:: 2025.findings-acl.933
Volume:: Findings of the Association for Computational Linguistics: ACL 2025
Month:: July
Year:: 2025
Address:: Vienna, Austria
Editors:: Wanxiang Che, Joyce Nabende, Ekaterina Shutova, Mohammad Taher Pilehvar
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 18144–18155
Language:
URL:: https://aclanthology.org/2025.findings-acl.933/
DOI:: 10.18653/v1/2025.findings-acl.933
Bibkey:
Cite (ACL):: Shuliang Liu, Hongyi Liu, Aiwei Liu, Duan Bingchen, Zheng Qi, Yibo Yan, He Geng, Peijie Jiang, Jia Liu, and Xuming Hu. 2025. A Survey on Proactive Defense Strategies Against Misinformation in Large Language Models. In Findings of the Association for Computational Linguistics: ACL 2025, pages 18144–18155, Vienna, Austria. Association for Computational Linguistics.
Cite (Informal):: A Survey on Proactive Defense Strategies Against Misinformation in Large Language Models (Liu et al., Findings 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.findings-acl.933.pdf

PDF Cite Search Fix data