RADS: Reinforcement Learning-Based Sample Selection Improves Transfer Learning in Low-resource and Imbalanced Clinical Settings

Wei Han; David Martinez Iraola; Anna Khanina; Lawrence Cavedon; Karin Verspoor

RADS: Reinforcement Learning-Based Sample Selection Improves Transfer Learning in Low-resource and Imbalanced Clinical Settings

Wei Han, David Martinez Iraola, Anna Khanina, Lawrence Cavedon, Karin Verspoor

Abstract

A common strategy in transfer learning is few shot fine-tuning, but its success is highly dependent on the quality of samples selected as training examples. Active learning methods such as uncertainty sampling and diversity sampling can select useful samples. However, under extremely low-resource and class-imbalanced conditions, they often favor outliers rather than truly informative samples, resulting in degraded performance. In this paper, we introduce RADS (Reinforcement Domain Adaptive Sampling), a robust sample selection strategy using reinforcement learning (RL) to identify the most informative samples. Experimental evaluations on several real world clinical datasets show our sample selection strategy enhances model transferability while maintaining robust performance under extreme class imbalance compared to traditional methods. Our code is open-sourced on GitHub.

Anthology ID:: 2026.findings-acl.608
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 12501–12516
Language:
URL:: https://aclanthology.org/2026.findings-acl.608/
DOI:
Bibkey:
Cite (ACL):: Wei Han, David Martinez Iraola, Anna Khanina, Lawrence Cavedon, and Karin Verspoor. 2026. RADS: Reinforcement Learning-Based Sample Selection Improves Transfer Learning in Low-resource and Imbalanced Clinical Settings. In Findings of the Association for Computational Linguistics: ACL 2026, pages 12501–12516, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: RADS: Reinforcement Learning-Based Sample Selection Improves Transfer Learning in Low-resource and Imbalanced Clinical Settings (Han et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.608.pdf
Checklist:: 2026.findings-acl.608.checklist.pdf

PDF Cite Search Checklist Fix data