XCOMPS: A Multilingual Benchmark of Conceptual Minimal Pairs

Linyang He; Ercong Nie; Sukru Samet Dindar; Arsalan Firoozi; Adrian Florea; Van Nguyen; Corentin Puffay; Riki Shimizu; Haotian Ye; Jonathan Brennan; Helmut Schmid; Hinrich Schütze; Nima Mesgarani

doi:10.18653/v1/2025.sigtyp-1.9

XCOMPS: A Multilingual Benchmark of Conceptual Minimal Pairs

Linyang He, Ercong Nie, Sukru Samet Dindar, Arsalan Firoozi, Adrian Florea, Van Nguyen, Corentin Puffay, Riki Shimizu, Haotian Ye, Jonathan Brennan, Helmut Schmid, Hinrich Schütze, Nima Mesgarani

Abstract

In this work, we introduce XCOMPS, a multilingual conceptual minimal pair dataset that covers 17 languages.Using this dataset, we evaluate LLMs’ multilingual conceptual understanding through metalinguistic prompting, direct probability measurement, and neurolinguistic probing. We find that: 1) LLMs exhibit weaker conceptual understanding for low-resource languages, and accuracy varies across languages despite being tested on the same concept sets. 2) LLMs excel at distinguishing concept-property pairs that are visibly different but exhibit a marked performance drop when negative pairs share subtle semantic similarities. 3) More morphologically complex languages yield lower concept understanding scores and require deeper layers for conceptual reasoning.

Anthology ID:: 2025.sigtyp-1.9
Volume:: Proceedings of the 7th Workshop on Research in Computational Linguistic Typology and Multilingual NLP
Month:: August
Year:: 2025
Address:: Vienna, Austria
Editors:: Michael Hahn, Priya Rani, Ritesh Kumar, Andreas Shcherbakov, Alexey Sorokin, Oleg Serikov, Ryan Cotterell, Ekaterina Vylomova
Venues:: SIGTYP | WS
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 75–81
Language:
URL:: https://aclanthology.org/2025.sigtyp-1.9/
DOI:: 10.18653/v1/2025.sigtyp-1.9
Bibkey:
Cite (ACL):: Linyang He, Ercong Nie, Sukru Samet Dindar, Arsalan Firoozi, Adrian Florea, Van Nguyen, Corentin Puffay, Riki Shimizu, Haotian Ye, Jonathan Brennan, Helmut Schmid, Hinrich Schütze, and Nima Mesgarani. 2025. XCOMPS: A Multilingual Benchmark of Conceptual Minimal Pairs. In Proceedings of the 7th Workshop on Research in Computational Linguistic Typology and Multilingual NLP, pages 75–81, Vienna, Austria. Association for Computational Linguistics.
Cite (Informal):: XCOMPS: A Multilingual Benchmark of Conceptual Minimal Pairs (He et al., SIGTYP 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.sigtyp-1.9.pdf

PDF Cite Search Fix data