Anti-Overestimation Dialogue Policy Learning for Task-Completion Dialogue System

Anti-Overestimation Dialogue Policy Learning for Task-Completion Dialogue System Chang Tian author Wenpeng Yin author Marie-Francine Moens author 2022-07 text Findings of the Association for Computational Linguistics: NAACL 2022 Marine Carpuat editor Marie-Catherine de Marneffe editor Ivan Vladimir Meza Ruiz editor Association for Computational Linguistics Seattle, United States conference publication tian-etal-2022-anti 10.18653/v1/2022.findings-naacl.43 https://aclanthology.org/2022.findings-naacl.43/ 2022-07 565 577