Reinforcement Learning with Token-level Feedback for Controllable Text Generation

Reinforcement Learning with Token-level Feedback for Controllable Text Generation Wendi Li author Wei Wei author Kaihe Xu author Wenfeng Xie author Dangyang Chen author Yu Cheng author 2024-06 text Findings of the Association for Computational Linguistics: NAACL 2024 Kevin Duh editor Helena Gomez editor Steven Bethard editor Association for Computational Linguistics Mexico City, Mexico conference publication li-etal-2024-reinforcement 10.18653/v1/2024.findings-naacl.111 https://aclanthology.org/2024.findings-naacl.111/ 2024-06 1704 1719