Prior Constraints-based Reward Model Training for Aligning Large Language Models

Prior Constraints-based Reward Model Training for Aligning Large Language Models Hang Zhou author Chenglong Wang author Yimin Hu author Tong Xiao author Chunliang Zhang author Jingbo Zhu author 2024-07 text eng Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 1: Main Conference) Sun Maosong editor Liang Jiye editor Han Xianpei editor Liu Zhiyuan editor He Yulan editor Chinese Information Processing Society of China Taiyuan, China conference publication hang-etal-2024-prior https://aclanthology.org/2024.ccl-1.107/ 2024-07 1395 1407