Extending ASR Evaluation Resources for Modern Greek Dialects

Chara Tsoukala; Stavros Bompolas; Antigoni Margariti; Konstantina Panagiotou; Maria Elisavet Plaiti; Nefeli Tzanakaki; Petros Karatsareas; Angela Ralli; Antonios Anastasopoulos; Stella Markantonatou

Extending ASR Evaluation Resources for Modern Greek Dialects

Chara Tsoukala, Stavros Bompolas, Antigoni Margariti, Konstantina Panagiotou, Maria Elisavet Plaiti, Nefeli Tzanakaki, Petros Karatsareas, Angela Ralli, Antonios Anastasopoulos, Stella Markantonatou

Abstract

Recent progress in Automatic Speech Recognition (ASR) has primarily benefited high-resource standard languages, while dialectal speech remains challenging and underexplored. We present an expanded benchmark for low-resource Modern Greek dialects, covering Aperathiot, Cretan, Lesbian, and Cappadocian, spanning southern, northern, and contact-influenced varieties with varying degrees of divergence from Standard Modern Greek. The benchmark provides dialectal transcriptions in the Greek alphabet, following SMG-based orthographic conventions, while preserving dialectal lexical and morphophonological forms. Using this benchmark, we evaluate state-of-the-art multilingual ASR models in a zero-shot setting and by further fine-tuning per dialect. Zero-shot results reveal a clear performance gradient with dialectal distance from Standard Modern Greek, with best WERs ranging from about 60-70% for southern dialects to over 80% for Lesbian and nearly 97% for Cappadocian. Fine-tuning substantially reduces error rates (up to 47% relative WER improvement), with Cappadocian remaining the most challenging variety (best WER 68.17%). Overall, our results highlight persistent limitations of current pretrained ASR models under dialectal variation and the need for dedicated benchmarks and adaptation strategies.

Anthology ID:: 2026.vardial-1.17
Volume:: Proceedings of the 13th Workshop on NLP for Similar Languages, Varieties and Dialects
Month:: March
Year:: 2026
Address:: Rabat, Morocco
Venues:: VarDial | WS
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 210–222
Language:
URL:: https://aclanthology.org/2026.vardial-1.17/
DOI:
Bibkey:
Cite (ACL):: Chara Tsoukala, Stavros Bompolas, Antigoni Margariti, Konstantina Panagiotou, Maria Elisavet Plaiti, Nefeli Tzanakaki, Petros Karatsareas, Angela Ralli, Antonios Anastasopoulos, and Stella Markantonatou. 2026. Extending ASR Evaluation Resources for Modern Greek Dialects. In Proceedings of the 13th Workshop on NLP for Similar Languages, Varieties and Dialects, pages 210–222, Rabat, Morocco. Association for Computational Linguistics.
Cite (Informal):: Extending ASR Evaluation Resources for Modern Greek Dialects (Tsoukala et al., VarDial 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.vardial-1.17.pdf

PDF Cite Search Fix data