Lightweight Query Checkpoint: Classifying Faulty User Queries to Mitigate Hallucinations in Large Language Model Question Answering

Minjoo Son; Jonghak Jang; Misuk Kim

doi:10.18653/v1/2025.findings-acl.756

Lightweight Query Checkpoint: Classifying Faulty User Queries to Mitigate Hallucinations in Large Language Model Question Answering

Abstract

Question Answering (QA) with large language models has shown impressive performance, yet hallucinations still persist, particularly when user queries carry incorrect premises, insufficient context, or linguistic ambiguity. To address this issue, we propose Lightweight Query Checkpoint (LQC), a small classification model that detects verification-required queries before the LLM generates a potentially faulty answer. LQC leverages hidden states extracted from intermediate layers of a smaller-scale, non-instruct-tuned LLM to effectively distinguish queries requiring verification from clear queries. We first systematically define categories of queries that need verification, construct a dataset comprising both defective and clear queries, and train a binary contrastive learning model. Through extensive experiments on various QA datasets, we demonstrate that incorporating LQC into QA pipelines reduces hallucinations while preserving strong answer quality.

Anthology ID:: 2025.findings-acl.756
Volume:: Findings of the Association for Computational Linguistics: ACL 2025
Month:: July
Year:: 2025
Address:: Vienna, Austria
Editors:: Wanxiang Che, Joyce Nabende, Ekaterina Shutova, Mohammad Taher Pilehvar
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 14664–14677
Language:
URL:: https://aclanthology.org/2025.findings-acl.756/
DOI:: 10.18653/v1/2025.findings-acl.756
Bibkey:
Cite (ACL):: Minjoo Son, Jonghak Jang, and Misuk Kim. 2025. Lightweight Query Checkpoint: Classifying Faulty User Queries to Mitigate Hallucinations in Large Language Model Question Answering. In Findings of the Association for Computational Linguistics: ACL 2025, pages 14664–14677, Vienna, Austria. Association for Computational Linguistics.
Cite (Informal):: Lightweight Query Checkpoint: Classifying Faulty User Queries to Mitigate Hallucinations in Large Language Model Question Answering (Son et al., Findings 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.findings-acl.756.pdf

PDF Cite Search Fix data