Context-DPO: Aligning Language Models for Context-Faithfulness

Baolong Bi; Shaohan Huang; Yiwei Wang; Tianchi Yang; Zihan Zhang; Haizhen Huang; Lingrui Mei; Junfeng Fang; Zehao Li; Furu Wei; Weiwei Deng; Feng Sun; Qi Zhang; Shenghua Liu

doi:10.18653/v1/2025.findings-acl.536

Context-DPO: Aligning Language Models for Context-Faithfulness

Baolong Bi, Shaohan Huang, Yiwei Wang, Tianchi Yang, Zihan Zhang, Haizhen Huang, Lingrui Mei, Junfeng Fang, Zehao Li, Furu Wei, Weiwei Deng, Feng Sun, Qi Zhang, Shenghua Liu

Abstract

Reliable responses from large language models (LLMs) require adherence to user instructions and retrieved information. While alignment techniques help LLMs align with human intentions and values, improving context-faithfulness through alignment remains underexplored. To address this, we propose Context-DPO, the first alignment method specifically designed to enhance LLMs’ context-faithfulness. We introduce ConFiQA, a benchmark that simulates Retrieval-Augmented Generation (RAG) scenarios with knowledge conflicts to evaluate context-faithfulness. By leveraging faithful and stubborn responses to questions with provided context from ConFiQA, our Context-DPO aligns LLMs through direct preference optimization. Extensive experiments demonstrate that our Context-DPO significantly improves context-faithfulness, achieving 35% to 280% improvements on popular open-source models. Further analysis demonstrates that Context-DPO preserves LLMs’ generative capabilities while providing interpretable insights into context utilization.

Anthology ID:: 2025.findings-acl.536
Volume:: Findings of the Association for Computational Linguistics: ACL 2025
Month:: July
Year:: 2025
Address:: Vienna, Austria
Editors:: Wanxiang Che, Joyce Nabende, Ekaterina Shutova, Mohammad Taher Pilehvar
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 10280–10300
Language:
URL:: https://aclanthology.org/2025.findings-acl.536/
DOI:: 10.18653/v1/2025.findings-acl.536
Bibkey:
Cite (ACL):: Baolong Bi, Shaohan Huang, Yiwei Wang, Tianchi Yang, Zihan Zhang, Haizhen Huang, Lingrui Mei, Junfeng Fang, Zehao Li, Furu Wei, Weiwei Deng, Feng Sun, Qi Zhang, and Shenghua Liu. 2025. Context-DPO: Aligning Language Models for Context-Faithfulness. In Findings of the Association for Computational Linguistics: ACL 2025, pages 10280–10300, Vienna, Austria. Association for Computational Linguistics.
Cite (Informal):: Context-DPO: Aligning Language Models for Context-Faithfulness (Bi et al., Findings 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.findings-acl.536.pdf

PDF Cite Search Fix data