From Numbers to Narratives: Efficient Language Model-Based Detection for Safety-Critical Minority Classes

Ahatsham Hayat; Hunter Tridle; Mohammad Rashedul Hasan

From Numbers to Narratives: Efficient Language Model-Based Detection for Safety-Critical Minority Classes

Ahatsham Hayat, Hunter Tridle, Mohammad Rashedul Hasan

Abstract

Safety-critical classification tasks face a persistent challenge: traditional models achieve high overall accuracy but inadequate performance on critical minority classes. We introduce a numbers to narratives framework that transforms tabular data into contextually rich descriptions, enabling language models to leverage pre-trained knowledge for minority class detection. Our approach integrates structured verbalization, linguistically-informed augmentation, and parameter-efficient fine-tuning to address the "minority class blind spot” in high-consequence domains. Using a significantly more efficient model architecture than existing approaches, our framework achieves superior minority class F1-scores: 78.76% for machine failures (+7.42 points over XGBoost), 65.87% for at-risk students (+12.12 points over MLP), and 32.00% for semiconductor failures (+1.01 points over XGBoost, despite 14:1 class imbalance). Our approach also improves overall accuracy by up to 22.43% in five of six datasets while maintaining computational feasibility. Ablation studies confirm that narrative-based verbalization enables effective reasoning about tabular data by contextualizing abstract numerical features. This work provides a practical, resource-efficient approach for enhancing minority class performance in safety-critical domains.

Anthology ID:: 2026.findings-eacl.258
Volume:: Findings of the Association for Computational Linguistics: EACL 2026
Month:: March
Year:: 2026
Address:: Rabat, Morocco
Editors:: Vera Demberg, Kentaro Inui, Lluís Marquez
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 4920–4937
Language:
URL:: https://aclanthology.org/2026.findings-eacl.258/
DOI:
Bibkey:
Cite (ACL):: Ahatsham Hayat, Hunter Tridle, and Mohammad Rashedul Hasan. 2026. From Numbers to Narratives: Efficient Language Model-Based Detection for Safety-Critical Minority Classes. In Findings of the Association for Computational Linguistics: EACL 2026, pages 4920–4937, Rabat, Morocco. Association for Computational Linguistics.
Cite (Informal):: From Numbers to Narratives: Efficient Language Model-Based Detection for Safety-Critical Minority Classes (Hayat et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-eacl.258.pdf
Checklist:: 2026.findings-eacl.258.checklist.pdf

PDF Cite Search Checklist Fix data