AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning

Zhong Zhang; Yaxi Lu; Yikun Fu; Yupeng Huo; Shenzhi Yang; Yesai Wu; Han Si; Xin Cong; Haotian Chen; Yankai Lin (林衍凯); Jie Xie; Wei Zhou; Wang Xu; Yuanheng Zhang; Zhou Su; Zhongwu Zhai; Xiaoming Liu; Yudong Mei; Jianming Xu; Hongyan Tian; Chongyi Wang; Chi Chen; Yuan Yao; Zhiyuan Liu; Maosong Sun

doi:10.18653/v1/2025.emnlp-demos.12

AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning

Zhong Zhang, Yaxi Lu, Yikun Fu, Yupeng Huo, Shenzhi Yang, Yesai Wu, Han Si, Xin Cong, Haotian Chen, Yankai Lin, Jie Xie, Wei Zhou, Wang Xu, Yuanheng Zhang, Zhou Su, Zhongwu Zhai, Xiaoming Liu, Yudong Mei, Jianming Xu, Hongyan Tian, Chongyi Wang, Chi Chen, Yuan Yao, Zhiyuan Liu, Maosong Sun

Abstract

Large language model agents have enabled GUI-based automation, particularly for mobile devices. However, deployment remains limited by noisy data, poor generalization, and lack of support for non-English GUIs. In this work, we present AgentCPM-GUI, an 8B-parameter GUI agent built for robust and efficient on-device GUI interaction. Our training pipeline includes grounding-aware pre-training to enhance perception, supervised fine-tuning on high-quality Chinese and English trajectories to imitate human-like actions, and reinforcement fine-tuning with GRPO to improve reasoning capability. AgentCPM-GUI achieves promising performance on five public benchmarks and our proposed Chinese benchmark CAGUI. To facilitate reproducibility and further research, we publicly release all code, model checkpoint, and evaluation data at: https://github.com/OpenBMB/AgentCPM-GUI

Anthology ID:: 2025.emnlp-demos.12
Volume:: Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing: System Demonstrations
Month:: November
Year:: 2025
Address:: Suzhou, China
Editors:: Ivan Habernal, Peter Schulam, Jörg Tiedemann
Venue:: EMNLP
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 155–180
Language:
URL:: https://aclanthology.org/2025.emnlp-demos.12/
DOI:: 10.18653/v1/2025.emnlp-demos.12
Bibkey:
Cite (ACL):: Zhong Zhang, Yaxi Lu, Yikun Fu, Yupeng Huo, Shenzhi Yang, Yesai Wu, Han Si, Xin Cong, Haotian Chen, Yankai Lin, Jie Xie, Wei Zhou, Wang Xu, Yuanheng Zhang, Zhou Su, Zhongwu Zhai, Xiaoming Liu, Yudong Mei, Jianming Xu, Hongyan Tian, Chongyi Wang, Chi Chen, Yuan Yao, Zhiyuan Liu, and Maosong Sun. 2025. AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning. In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing: System Demonstrations, pages 155–180, Suzhou, China. Association for Computational Linguistics.
Cite (Informal):: AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning (Zhang et al., EMNLP 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.emnlp-demos.12.pdf

PDF Cite Search Fix data