NASH: Numerically Aware Scoring Heuristic for Robust Semantic Similarity

Yu-Shiang Huang; Yun-Yu Lee; Tzu-Hsin Chou; Che Lin; Chuan-Ju Wang

NASH: Numerically Aware Scoring Heuristic for Robust Semantic Similarity

Yu-Shiang Huang, Yun-Yu Lee, Tzu-Hsin Chou, Che Lin, Chuan-Ju Wang

Abstract

Numerical precision is critical in financial NLP, yet embedding-based semantic similarity metrics exhibit numerical blindness—failing to distinguish contradictory values within similar contexts. We introduce NASH (Numerically Aware Scoring Hueristic), a model-agnostic metric that decouples numerical verification from textual semantic evaluation through a three-stage pipeline: (1) modal separation via numeric masking, (2) dual-channel similarity estimation through masked-text similarity and context-aware numeric alignment, and (3) IDF-weighted aggregation. NASH functions as a drop-in enhancement to existing embedding-based metrics. Validated on our proposed NumFinE financial numerical evaluation benchmark and established semantic similarity datasets (STS-B, Financial-STS), NASH achieves substantial improvements in numerical sensitivity (up to +159.6% on listwise ranking) while preserving general semantic performance, establishing a reliable standard for numeracy-aware evaluation.

Anthology ID:: 2026.findings-acl.1119
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 22303–22317
Language:
URL:: https://aclanthology.org/2026.findings-acl.1119/
DOI:
Bibkey:
Cite (ACL):: Yu-Shiang Huang, Yun-Yu Lee, Tzu-Hsin Chou, Che Lin, and Chuan-Ju Wang. 2026. NASH: Numerically Aware Scoring Heuristic for Robust Semantic Similarity. In Findings of the Association for Computational Linguistics: ACL 2026, pages 22303–22317, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: NASH: Numerically Aware Scoring Heuristic for Robust Semantic Similarity (Huang et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1119.pdf
Checklist:: 2026.findings-acl.1119.checklist.pdf

PDF Cite Search Checklist Fix data