Mitigating Spurious Correlations in Text Classification Using Latent Space Geometry

Jiasen Gao; Xiaoliang Chen; Duoqian Miao; Xu Gu; Xianyong Li; Yajun Du

Mitigating Spurious Correlations in Text Classification Using Latent Space Geometry

Jiasen Gao, Xiaoliang Chen, Duoqian Miao, Xu Gu, Xianyong Li, Yajun Du

Abstract

Spurious correlations cause deep learning models to rely on predictive shortcuts that hold in the training data but break under distribution shifts, leading to large performance drops for minority groups. Existing strategies often rely on costly group annotations or employ unstable adversarial training. In this paper, we propose Prototype-guided debiasing using Robust Invariant Feature Transformations (PRIFT), a novel framework that mitigates spurious correlations by manipulating latent space geometry. Specifically, we introduce a prototype-guided modeling approach that leverages natural language prompts to represent confounders, transforming abstract biases into interpretable geometric anchors without auxiliary classifiers. Based on these anchors, we introduce a centered projection operator that adaptively purifies representations by removing confounding deviations specific to instances while preserving essential semantic structure. Furthermore, PRIFT can handle confounding factor information at different levels, ranging from true labels to unsupervised latent inference. Experiments on four text classification benchmarks demonstrate the superiority of our method; notably, PRIFT outperforms state-of-the-art baselines and improves worst-group accuracy by over 20% on the CivilComments dataset compared to standard empirical risk minimization.

Anthology ID:: 2026.acl-long.1270
Volume:: Proceedings of the 64th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: ACL
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 27525–27539
Language:
URL:: https://aclanthology.org/2026.acl-long.1270/
DOI:
Bibkey:
Cite (ACL):: Jiasen Gao, Xiaoliang Chen, Duoqian Miao, Xu Gu, Xianyong Li, and Yajun Du. 2026. Mitigating Spurious Correlations in Text Classification Using Latent Space Geometry. In Proceedings of the 64th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 27525–27539, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Mitigating Spurious Correlations in Text Classification Using Latent Space Geometry (Gao et al., ACL 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.acl-long.1270.pdf
Checklist:: 2026.acl-long.1270.checklist.pdf

PDF Cite Search Checklist Fix data