Large Language Models Are Poor Clinical Decision-Makers: A Comprehensive Benchmark

Large Language Models Are Poor Clinical Decision-Makers: A Comprehensive Benchmark Fenglin Liu author Zheng Li author Hongjian Zhou author Qingyu Yin author Jingfeng Yang author Xianfeng Tang author Chen Luo author Ming Zeng author Haoming Jiang author Yifan Gao author Priyanka Nigam author Sreyashi Nag author Bing Yin author Yining Hua author Xuan Zhou author Omid Rohanian author Anshul Thakur author Lei Clifton author David A Clifton author 2024-11 text Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing Yaser Al-Onaizan editor Mohit Bansal editor Yun-Nung Chen editor Association for Computational Linguistics Miami, Florida, USA conference publication liu-etal-2024-large 10.18653/v1/2024.emnlp-main.759 https://aclanthology.org/2024.emnlp-main.759/ 2024-11 13696 13710