Task-Stratified Knowledge Scaling Laws for Post-Training Quantized Large Language Models

Chenxi Zhou; Pengfei Cao (鹏飞 曹); Jiang Li; Bohan Yu; Jinyu Ye; Jun Zhao; Kang Liu

Task-Stratified Knowledge Scaling Laws for Post-Training Quantized Large Language Models

Chenxi Zhou, Pengfei Cao, Jiang Li, Bohan Yu, Jinyu Ye, Jun Zhao, Kang Liu

Abstract

Post-Training Quantization (PTQ) is a critical strategy for efficient large language models (LLMs) deployment. However, existing scaling laws primarily focus on general performance, overlooking crucial fine-grained factors and how quantization differentially impacts diverse knowledge capabilities. To address this, we establish Task-Stratified Knowledge Scaling Laws. By stratifying capabilities into memorization, application, and reasoning, we develop a framework that unifies model size, bit-width, and fine-grained factors: group size and calibration set size. Validated on 293 diverse PTQ configurations, our framework demonstrates strong fit and cross-architecture consistency. It reveals distinct sensitivities across knowledge capabilities: reasoning is precision-critical, application is scale-responsive, and memorization is calibration-sensitive. We highlight that in low-bit scenarios, optimizing these fine-grained factors is essential for preventing performance collapse. These findings provide an empirically-backed foundation for designing knowledge-aware quantization strategies.

Anthology ID:: 2026.findings-acl.1165
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 23268–23285
Language:
URL:: https://aclanthology.org/2026.findings-acl.1165/
DOI:
Bibkey:
Cite (ACL):: Chenxi Zhou, Pengfei Cao, Jiang Li, Bohan Yu, Jinyu Ye, Jun Zhao, and Kang Liu. 2026. Task-Stratified Knowledge Scaling Laws for Post-Training Quantized Large Language Models. In Findings of the Association for Computational Linguistics: ACL 2026, pages 23268–23285, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Task-Stratified Knowledge Scaling Laws for Post-Training Quantized Large Language Models (Zhou et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1165.pdf
Checklist:: 2026.findings-acl.1165.checklist.pdf

PDF Cite Search Checklist Fix data