MedEval: A Multi-Level, Multi-Task, and Multi-Domain Medical Benchmark for Language Model Evaluation

MedEval: A Multi-Level, Multi-Task, and Multi-Domain Medical Benchmark for Language Model Evaluation Zexue He author Yu Wang author An Yan author Yao Liu author Eric Chang author Amilcare Gentili author Julian McAuley author Chun-Nan Hsu author 2023-12 text Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing Houda Bouamor editor Juan Pino editor Kalika Bali editor Association for Computational Linguistics Singapore conference publication he-etal-2023-medeval 10.18653/v1/2023.emnlp-main.540 https://aclanthology.org/2023.emnlp-main.540/ 2023-12 8725 8744