FaStFact: Faster, Stronger Long-Form Factuality Evaluations in LLMs

Yingjia Wan; Haochen Tan; Xiao Zhu; Xinyu Zhou; Zhiwei Li; Qingsong Lv; Changxuan Sun; Jiaqi Zeng; Yi Xu; Jianqiao Lu; Yinhong Liu; Zhijiang Guo

doi:10.18653/v1/2025.findings-emnlp.1295

FaStFact: Faster, Stronger Long-Form Factuality Evaluations in LLMs

Yingjia Wan, Haochen Tan, Xiao Zhu, Xinyu Zhou, Zhiwei Li, Qingsong Lv, Changxuan Sun, Jiaqi Zeng, Yi Xu, Jianqiao Lu, Yinhong Liu, Zhijiang Guo

Abstract

Evaluating the factuality of long-form generations from Large Language Models (LLMs) remains challenging due to accuracy issues and costly human assessment. Prior evaluation pipelines attempt this by decomposing text into claims, searching for evidence, and verifying claims, but suffer from critical drawbacks: (1) inefficiency due to complex pipeline components unsuitable for long LLM outputs, and (2) ineffectiveness stemming from inaccurate claim sets and insufficient evidence collection of one-line SERP snippets. To address these limitations, we adapt the existing decompose-then-verify evaluation framework and propose **FaStFact**, a fast and strong evaluation pipeline that achieves the highest alignment with human evaluation and efficiency among existing baselines. FaStFact first employs chunk-level claim extraction integrated with confidence-based pre-verification, significantly reducing the cost of web searching and inference calling while ensuring reliability. For searching and verification, it gathers document-level evidence from crawled website pages for retrieval during verification, addressing the evidence insufficiency problem in previous pipelines. Extensive experiments based on an aggregated and manually annotated benchmark demonstrate the reliability of FaStFact in both efficiently and effectively evaluating the factuality of long-form LLM generations. We submit the paper with code and benchmark, and will make them publicly available to facilitate research.

Anthology ID:: 2025.findings-emnlp.1295
Volume:: Findings of the Association for Computational Linguistics: EMNLP 2025
Month:: November
Year:: 2025
Address:: Suzhou, China
Editors:: Christos Christodoulopoulos, Tanmoy Chakraborty, Carolyn Rose, Violet Peng
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 23814–23854
Language:
URL:: https://aclanthology.org/2025.findings-emnlp.1295/
DOI:: 10.18653/v1/2025.findings-emnlp.1295
Bibkey:
Cite (ACL):: Yingjia Wan, Haochen Tan, Xiao Zhu, Xinyu Zhou, Zhiwei Li, Qingsong Lv, Changxuan Sun, Jiaqi Zeng, Yi Xu, Jianqiao Lu, Yinhong Liu, and Zhijiang Guo. 2025. FaStFact: Faster, Stronger Long-Form Factuality Evaluations in LLMs. In Findings of the Association for Computational Linguistics: EMNLP 2025, pages 23814–23854, Suzhou, China. Association for Computational Linguistics.
Cite (Informal):: FaStFact: Faster, Stronger Long-Form Factuality Evaluations in LLMs (Wan et al., Findings 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.findings-emnlp.1295.pdf
Checklist:: 2025.findings-emnlp.1295.checklist.pdf

PDF Cite Search Checklist Fix data