Training-Free Adaptive Speculative Decoding via Linguistic Priors

Jingyi Wang; Jiaqi Huang; Zunnan Xu; Jun Zhou; Kehong Yuan; Xiang Qian

Training-Free Adaptive Speculative Decoding via Linguistic Priors

Jingyi Wang, Jiaqi Huang, Zunnan Xu, Jun Zhou, Kehong Yuan, Xiang Qian

Abstract

Speculative decoding (SPD) has emerged as a promising technique to accelerate Large Language Model (LLM) inference. However, current approaches typically enforce a uniform verification standard, neglecting the inherent heterogeneity of natural language and failing to distinguish between semantically-rich content and structurally-predictable syntax. In this paper, we propose LinguaSpec, a training-free framework that leverages linguistic priors to enable adaptive drafting and verification. Specifically, we introduce: (1) a Static Linguistic Probe (SLP) to categorize tokens with zero latency; (2) Syntactic Normalized Surprisal (SNS) to calibrate uncertainty against category-specific entropy; and (3) a dual strategy of Syntactically-Guided Elastic Expansion and POS-Adaptive Deferred Verification to dynamically adjust drafting depth and verification rigor. By balancing semantic integrity with structural efficiency, LinguaSpec significantly accelerates inference without requiring additional training. Experimental results demonstrate its superior performance across diverse benchmarks.

Anthology ID:: 2026.findings-acl.1065
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 21184–21194
Language:
URL:: https://aclanthology.org/2026.findings-acl.1065/
DOI:
Bibkey:
Cite (ACL):: Jingyi Wang, Jiaqi Huang, Zunnan Xu, Jun Zhou, Kehong Yuan, and Xiang Qian. 2026. Training-Free Adaptive Speculative Decoding via Linguistic Priors. In Findings of the Association for Computational Linguistics: ACL 2026, pages 21184–21194, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Training-Free Adaptive Speculative Decoding via Linguistic Priors (Wang et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1065.pdf
Checklist:: 2026.findings-acl.1065.checklist.pdf

PDF Cite Search Checklist Fix data