Fin-STAR: Structure-as-Semantics to Resolve Implicitness in Financial Retrieval

Yu Zou (邹煜); Yan Chen; Lida He; Qi Zhou; Xiaorui Zhou; Aixi Zhong; Yi Wang; Wei Li; Qingyu Wang; Jiatao Li; Wei Gong; Jialei Zeng; Jingmei Zhao; Ke Jiang; Qing Li

Fin-STAR: Structure-as-Semantics to Resolve Implicitness in Financial Retrieval

Yu Zou, Yan Chen, Lida He, Qi Zhou, Xiaorui Zhou, Aixi Zhong, Yi Wang, Wei Li, Qingyu Wang, Jiatao Li, Wei Gong, Jialei Zeng, Jingmei Zhao, Ke Jiang, Qing Li

Abstract

Understanding financial documents is critical for high-stakes decision-making yet hindered by systemic semantic implicitness: key facts are rarely explicit in surface text and often determined by global structural cues. Missing these cues invites semantic misinterpretations, such as misreading what a number refers to, an outcome unacceptable in high-stakes environments. However, existing Retrieval-Augmented Generation (RAG) systems typically treat structure as a physical navigational skeleton rather than intrinsic semantic knowledge. To address this, we introduce Fin-STAR (Financial STructure-As-Semantics Retrieval), a framework redefining hierarchy as intrinsic semantics. Fin-STAR incorporates a novel Structure-Enriched Semantic Indexing mechanism that augments the hierarchical lineage with snippet-derived virtual nodes, and injects this enriched context via a semantic cross-attention paradigm, rendering implicit cues explicit. By grounding evidence within its structural scope, we preserve factual invariance and ensure contextual integrity. Addressing the lack of granular public datasets, we conduct experiments on FinTierQA Gold, a curated expert benchmark. Results show that Fin-STAR outperforms state-of-the-art hierarchical and graph-based baselines across diverse query complexities, document types, and markets. Notably, ablations confirm that our semantic injection consistently outperforms alternative strategies. Finally, we release FinTierQA, comprising 3.9M pairs automatically constructed from 78k documents via our framework .

Anthology ID:: 2026.findings-acl.2151
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 43334–43347
Language:
URL:: https://aclanthology.org/2026.findings-acl.2151/
DOI:
Bibkey:
Cite (ACL):: Yu Zou, Yan Chen, Lida He, Qi Zhou, Xiaorui Zhou, Aixi Zhong, Yi Wang, Wei Li, Qingyu Wang, Jiatao Li, Wei Gong, Jialei Zeng, Jingmei Zhao, Ke Jiang, and Qing Li. 2026. Fin-STAR: Structure-as-Semantics to Resolve Implicitness in Financial Retrieval. In Findings of the Association for Computational Linguistics: ACL 2026, pages 43334–43347, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Fin-STAR: Structure-as-Semantics to Resolve Implicitness in Financial Retrieval (Zou et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.2151.pdf
Checklist:: 2026.findings-acl.2151.checklist.pdf

PDF Cite Search Checklist Fix data