ALaRM: Align Language Models via Hierarchical Rewards Modeling

ALaRM: Align Language Models via Hierarchical Rewards Modeling Yuhang Lai author Siyuan Wang author Shujun Liu author Xuanjing Huang author Zhongyu Wei author 2024-08 text Findings of the Association for Computational Linguistics: ACL 2024 Lun-Wei Ku editor Andre Martins editor Vivek Srikumar editor Association for Computational Linguistics Bangkok, Thailand conference publication lai-etal-2024-alarm 10.18653/v1/2024.findings-acl.465 https://aclanthology.org/2024.findings-acl.465/ 2024-08 7817 7831