MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG

Pingyu Wu; Daiheng Gao; Jing Tang; Huimin Chen; Wenbo Zhou; Weiming Zhang; Nenghai Yu

doi:10.18653/v1/2025.findings-naacl.241

MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG

Pingyu Wu, Daiheng Gao, Jing Tang, Huimin Chen, Wenbo Zhou, Weiming Zhang, Nenghai Yu

Abstract

Retrieval-Augmented Generation (RAG) improves Large Language Models (LLMs) by using external knowledge, but it struggles with precise entity information retrieval. Our proposed **MES-RAG** framework enhances entity-specific query handling and provides accurate, secure, and consistent responses. MES-RAG introduces proactive security measures that ensure system integrity by applying protections prior to data access. Additionally, the system supports real-time multi-modal outputs, including text, images, audio, and video, seamlessly integrating into existing RAG architectures. Experimental results demonstrate that MES-RAG significantly improves both accuracy and recall, highlighting its effectiveness in advancing the security and utility of question-answering, increasing accuracy to **0.83 (+0.25)** on targeted task. Our code and data are available at https://github.com/wpydcr/MES-RAG.

Anthology ID:: 2025.findings-naacl.241
Volume:: Findings of the Association for Computational Linguistics: NAACL 2025
Month:: April
Year:: 2025
Address:: Albuquerque, New Mexico
Editors:: Luis Chiruzzo, Alan Ritter, Lu Wang
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 4287–4298
Language:
URL:: https://aclanthology.org/2025.findings-naacl.241/
DOI:: 10.18653/v1/2025.findings-naacl.241
Bibkey:
Cite (ACL):: Pingyu Wu, Daiheng Gao, Jing Tang, Huimin Chen, Wenbo Zhou, Weiming Zhang, and Nenghai Yu. 2025. MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG. In Findings of the Association for Computational Linguistics: NAACL 2025, pages 4287–4298, Albuquerque, New Mexico. Association for Computational Linguistics.
Cite (Informal):: MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG (Wu et al., Findings 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.findings-naacl.241.pdf

PDF Cite Search Fix data