TRAC: Token-level Reward Assignment for Coherent Abstractive Summarization

陈宣齐; 容梓莹; Xinfeng Liao; Lianxi Wang; Ying Gao; Shengyi Jiang

doi:10.18653/v1/2026.findings-acl.1873

TRAC: Token-level Reward Assignment for Coherent Abstractive Summarization

陈宣齐, 容梓莹, Xinfeng Liao, Lianxi Wang, Ying Gao, Shengyi Jiang

Abstract

Large Language Models (LLMs) have achieved remarkable success in text summarization, particularly through the integration of reinforcement learning. However, maintaining logical coherence and contextual consistency remains a pervasive challenge in long-form generation, often hindering the production of high-quality, unified summaries. To address these persistent issues, we propose TRAC, a framework that introduces a token-level reward function by integrating relative sentence gain, inter-sentence attention, and a Gaussian length penalty. By training a Process Reward Model (PRM) to provide fine-grained, step-wise supervision, TRAC ensures superior structural integrity and fluency during the generation process. Experimental results demonstrate that TRAC outperforms the sequence-level baseline by 11.05% in Fluency and 10.61% in Relevance. Furthermore, it achieves significant gains over competitive baselines such as FIGA and TLCR, underscoring its effectiveness and generalizability in high-quality NLP summarization.

Anthology ID:: 2026.findings-acl.1873
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 37563–37578
Language:
URL:: https://aclanthology.org/2026.findings-acl.1873/
DOI:: 10.18653/v1/2026.findings-acl.1873
Bibkey:
Cite (ACL):: 陈宣齐, 容梓莹, Xinfeng Liao, Lianxi Wang, Ying Gao, and Shengyi Jiang. 2026. TRAC: Token-level Reward Assignment for Coherent Abstractive Summarization. In Findings of the Association for Computational Linguistics: ACL 2026, pages 37563–37578, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: TRAC: Token-level Reward Assignment for Coherent Abstractive Summarization (陈宣齐 et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1873.pdf
Checklist:: 2026.findings-acl.1873.checklist.pdf

PDF Cite Search Checklist Fix data