Mitigating Coordinate Prediction Bias from Positional Encoding Failures

Xingjian Tao; Yiwei Wang; Yujun Cai; Yihong Luo; Kai Han; Jing Tang

Mitigating Coordinate Prediction Bias from Positional Encoding Failures

Xingjian Tao, Yiwei Wang, Yujun Cai, Yihong Luo, Kai Han, Jing Tang

Abstract

While Multimodal Large Language Models (MLLMs) excel at general vision-language tasks, precise coordinate prediction remains a significant challenge, particularly as high-resolution inputs cause visual positional encodings (VPEs) to degrade. We demonstrate that these encoding failures do not result in random noise but instead trigger predictable, directional biases, suggesting that models default to internal spatial priors when grounding signals are weak. To counteract this, we introduce Vision-PE Shuffle Guidance (VPSG), a training-free, inference-time correction method. VPSG isolates position-unconditioned tendencies by shuffling VPEs and utilizes this negative evidence to steer digit decoding through a lightweight finite-state machine. Evaluation on the ScreenSpot-Pro benchmark confirms that VPSG effectively rectifies coordinate drift, yielding consistent improvements in localization accuracy across various model scales without any retraining.

Anthology ID:: 2026.findings-acl.1034
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 20635–20650
Language:
URL:: https://aclanthology.org/2026.findings-acl.1034/
DOI:
Bibkey:
Cite (ACL):: Xingjian Tao, Yiwei Wang, Yujun Cai, Yihong Luo, Kai Han, and Jing Tang. 2026. Mitigating Coordinate Prediction Bias from Positional Encoding Failures. In Findings of the Association for Computational Linguistics: ACL 2026, pages 20635–20650, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Mitigating Coordinate Prediction Bias from Positional Encoding Failures (Tao et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1034.pdf
Checklist:: 2026.findings-acl.1034.checklist.pdf

PDF Cite Search Checklist Fix data