MATH-IDN: A Multilingual Mathematical Problem Solving Dataset Featuring Local Languages in Indonesia

Xiao Xiao; Iftitahu Ni'mah; Yuyun Wabula; Mykola Pechenizkiy; Meng Fang

MATH-IDN: A Multilingual Mathematical Problem Solving Dataset Featuring Local Languages in Indonesia

Xiao Xiao, Iftitahu Ni'mah, Yuyun Wabula, Mykola Pechenizkiy, Meng Fang

Abstract

Large Language Models (LLMs) excel at mathematical reasoning in English, but their performance in low-resource languages remains underexplored. This gap is particularly critical in the Indonesian context, where equitable access to AI systems depends on robust multilingual reasoning across diverse local languages.We introduce MATH-IDN, a multilingual benchmark for mathematical problem solving in Indonesian, Javanese, Sundanese, and Buginese, with English as a reference, following the MATH dataset. We evaluate multiple open-source LLMs, including math-specialized, Southeast-Asian-adapted, and general-purpose models, under a zero-shot chain-of-thought setting. Results show that MATH-IDN presents a challenging and discriminative benchmark, revealing substantial performance gaps in low-resource languages, particularly Buginese, and highlighting key limitations in current multilingual reasoning capabilities. Our data and code are available at https://github.com/aialt/MATH-IND.

Anthology ID:: 2026.findings-eacl.231
Volume:: Findings of the Association for Computational Linguistics: EACL 2026
Month:: March
Year:: 2026
Address:: Rabat, Morocco
Editors:: Vera Demberg, Kentaro Inui, Lluís Marquez
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 4432–4438
Language:
URL:: https://aclanthology.org/2026.findings-eacl.231/
DOI:
Bibkey:
Cite (ACL):: Xiao Xiao, Iftitahu Ni'mah, Yuyun Wabula, Mykola Pechenizkiy, and Meng Fang. 2026. MATH-IDN: A Multilingual Mathematical Problem Solving Dataset Featuring Local Languages in Indonesia. In Findings of the Association for Computational Linguistics: EACL 2026, pages 4432–4438, Rabat, Morocco. Association for Computational Linguistics.
Cite (Informal):: MATH-IDN: A Multilingual Mathematical Problem Solving Dataset Featuring Local Languages in Indonesia (Xiao et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-eacl.231.pdf
Checklist:: 2026.findings-eacl.231.checklist.pdf

PDF Cite Search Checklist Fix data