Exploring Very Low-Resource Translation with LLMs: The University of Edinburgh’s Submission to AmericasNLP 2024 Translation Task

Vivek Iyer; Bhavitvya Malik; Wenhao Zhu; Pavel Stepachev; Pinzhen Chen; Barry Haddow; Alexandra Birch

doi:10.18653/v1/2024.americasnlp-1.25

Exploring Very Low-Resource Translation with LLMs: The University of Edinburgh’s Submission to AmericasNLP 2024 Translation Task

Vivek Iyer, Bhavitvya Malik, Wenhao Zhu, Pavel Stepachev, Pinzhen Chen, Barry Haddow, Alexandra Birch

Abstract

This paper describes the University of Edinburgh’s submission to the AmericasNLP 2024 shared task on the translation of Spanish into 11 indigenous American languages. We explore the ability of multilingual Large Language Models (LLMs) to model low-resource languages by continued pre-training with LoRA, and conduct instruction fine-tuning using a variety of datasets, demonstrating that this improves LLM performance. Furthermore, we demonstrate the efficacy of checkpoint averaging alongside decoding techniques like beam search and sampling, resulting in further improvements. We participate in all 11 translation directions.

Anthology ID:: 2024.americasnlp-1.25
Volume:: Proceedings of the 4th Workshop on Natural Language Processing for Indigenous Languages of the Americas (AmericasNLP 2024)
Month:: June
Year:: 2024
Address:: Mexico City, Mexico
Editors:: Manuel Mager, Abteen Ebrahimi, Shruti Rijhwani, Arturo Oncevay, Luis Chiruzzo, Robert Pugh, Katharina von der Wense
Venues:: AmericasNLP | WS
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 209–220
Language:
URL:: https://aclanthology.org/2024.americasnlp-1.25
DOI:: 10.18653/v1/2024.americasnlp-1.25
Bibkey:
Cite (ACL):: Vivek Iyer, Bhavitvya Malik, Wenhao Zhu, Pavel Stepachev, Pinzhen Chen, Barry Haddow, and Alexandra Birch. 2024. Exploring Very Low-Resource Translation with LLMs: The University of Edinburgh’s Submission to AmericasNLP 2024 Translation Task. In Proceedings of the 4th Workshop on Natural Language Processing for Indigenous Languages of the Americas (AmericasNLP 2024), pages 209–220, Mexico City, Mexico. Association for Computational Linguistics.
Cite (Informal):: Exploring Very Low-Resource Translation with LLMs: The University of Edinburgh’s Submission to AmericasNLP 2024 Translation Task (Iyer et al., AmericasNLP-WS 2024)
Copy Citation:
PDF:: https://aclanthology.org/2024.americasnlp-1.25.pdf
Supplementary material:: 2024.americasnlp-1.25.SupplementaryMaterial.zip

PDF Cite Search Supplementary material