Mardiyyah Oduwole - ACL Anthology

Mardiyyah Oduwole

2026

AfriCaption: Establishing a New Paradigm for Image Captioning in African Languages
Mardiyyah Oduwole | Prince Mireku | Fatimo Adebanjo | Oluwatosin Olajide | Mahi Aminu Aliyu | Jekaterina Novikova
Proceedings of the 7th Workshop on African Natural Language Processing (AfricaNLP 2026)

Multimodal AI research has overwhelmingly focused on high-resource languages, hindering the democratization of advancements in the field. To address this, we present AfriCaption, a comprehensive framework for multilingual image captioning in 20 African languages and our contributions are threefold: (i) a curated dataset built on Flickr8k, featuring semantically aligned captions generated via a context-aware selection and translation process; (ii) a dynamic, context-preserving pipeline that ensures ongoing quality through model ensembling and adaptive substitution; and (iii) the AfriCaption model, a 0.5B parametervision-to-text architecture that integrates SigLIP and NLLB200 for caption generation across underrepresented languages. This unified framework ensures ongoing data quality and establishes the first scalable image-captioning resource for underrepresented African languages, laying the groundwork for truly inclusive multimodal AI.

2023

MasakhaNEWS: News Topic Classification for African languages
David Ifeoluwa Adelani | Marek Masiak | Israel Abebe Azime | Jesujoba Alabi | Atnafu Lambebo Tonja | Christine Mwase | Odunayo Ogundepo | Bonaventure F. P. Dossou | Akintunde Oladipo | Doreen Nixdorf | Chris Chinenye Emezue | Sana Al-azzawi | Blessing Sibanda | Davis David | Lolwethu Ndolela | Jonathan Mukiibi | Tunde Ajayi | Tatiana Moteu | Brian Odhiambo | Abraham Owodunni | Nnaemeka Obiefuna | Muhidin Mohamed | Shamsuddeen Hassan Muhammad | Teshome Mulugeta Ababu | Saheed Abdullahi Salahudeen | Mesay Gemeda Yigezu | Tajuddeen Gwadabe | Idris Abdulmumin | Mahlet Taye | Oluwabusayo Awoyomi | Iyanuoluwa Shode | Tolulope Adelani | Habiba Abdulganiyu | Abdul-Hakeem Omotayo | Adetola Adeeko | Abeeb Afolabi | Anuoluwapo Aremu | Olanrewaju Samuel | Clemencia Siro | Wangari Kimotho | Onyekachi Ogbu | Chinedu Mbonu | Chiamaka Chukwuneke | Samuel Fanijo | Jessica Ojo | Oyinkansola Awosan | Tadesse Kebede | Toadoum Sari Sakayo | Pamela Nyatsine | Freedmore Sidume | Oreen Yousuf | Mardiyyah Oduwole | Kanda Tshinu | Ussen Kimanuka | Thina Diko | Siyanda Nxakama | Sinodos Nigusse | Abdulmejid Johar | Shafie Mohamed | Fuad Mire Hassan | Moges Ahmed Mehamed | Evrard Ngabire | Jules Jules | Ivan Ssenkungu | Pontus Stenetorp
Proceedings of the 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics (Volume 1: Long Papers)

Masakhane-Afrisenti at SemEval-2023 Task 12: Sentiment Analysis using Afro-centric Language Models and Adapters for Low-resource African Languages
Israel Abebe Azime | Sana Sabah Al-Azzawi | Atnafu Lambebo Tonja | Iyanuoluwa Shode | Jesujoba Alabi | Ayodele Awokoya | Mardiyyah Oduwole | Tosin Adewumi | Samuel Fanijo | Awosan Oyinkansola | Oreen Yousuf
Proceedings of the 17th International Workshop on Semantic Evaluation (SemEval-2023)

Detecting harmful content on social media plat-forms is crucial in preventing the negative ef-fects these posts can have on social media users. This paper presents our methodology for tack-ling task 10 from SemEval23, which focuseson detecting and classifying online sexism insocial media posts. We constructed our solu-tion using an ensemble of transformer-basedmodels (that have been fine-tuned; BERTweet,RoBERTa, and DeBERTa). To alleviate the var-ious issues caused by the class imbalance inthe dataset provided and improve the general-ization of our model, our framework employsdata augmentation and semi-supervised learn-ing. Specifically, we use back-translation fordata augmentation in two scenarios: augment-ing the underrepresented class and augment-ing all classes. In this study, we analyze theimpact of these different strategies on the sys-tem’s overall performance and determine whichtechnique is the most effective. Extensive ex-periments demonstrate the efficacy of our ap-proach. For sub-task A, the system achievedan F1-score of 0.8613. The source code to re-produce the proposed solutions is available onGithub

Co-authors

Teshome Mulugeta Ababu 1

Habiba Abdulganiyu 1

Idris Abdulmumin 1

Fatimo Adebanjo 1

Adetola Adeeko 1

David Ifeoluwa Adelani 1

Tolulope Adelani 1

Tosin Adewumi 1

Abeeb Afolabi 1

Sana Al-Azzawi 1

Sana Sabah Al-Azzawi 1

Mahi Aminu Aliyu 1

Anuoluwapo Aremu 1

Ayodele Awokoya 1

Oyinkansola Awosan 1

Oluwabusayo Awoyomi 1

Chiamaka Chukwuneke 1

Bonaventure F. P. Dossou 1

Chris Chinenye Emezue 1

Tajuddeen Gwadabe 1

Fuad Mire Hassan 1

Abdulmejid Johar 1

Tadesse Kebede 1

Ussen Kimanuka 1

Wangari Kimotho 1

Chinedu Mbonu 1

Moges Ahmed Mehamed 1

Prince Mireku 1

Muhidin Mohamed 1

Shafie Mohamed 1

Tatiana Moteu 1

Shamsuddeen Hassan Muhammad 1

Jonathan Mukiibi 1

Christine Mwase 1

Lolwethu Ndolela 1

Evrard Ngabire 1

Sinodos Nigusse 1

Doreen Nixdorf 1

Jekaterina Novikova 1

Siyanda Nxakama 1

Pamela Nyatsine 1

Nnaemeka Obiefuna 1

Brian Odhiambo 1

Onyekachi Ogbu 1

Odunayo Ogundepo 1

Akintunde Oladipo 1

Oluwatosin Olajide 1

Abdul-Hakeem Omotayo 1

Abraham Toluwase Owodunni 1

Awosan Oyinkansola 1

Toadoum Sari Sakayo 1

Saheed Abdullahi Salahudeen 1

Olanrewaju Samuel 1

Blessing Kudzaishe Sibanda 1

Freedmore Sidume 1

Clemencia Siro 1

Ivan Ssenkungu 1

Pontus Stenetorp 1

Mesay Gemeda Yigezu 1

Venues