Empirical Study on Data Attributes Insufficiency of Evaluation Benchmarks for LLMs

Empirical Study on Data Attributes Insufficiency of Evaluation Benchmarks for LLMs Chuang Liu author Renren Jin author Zheng Yao author Tianyi Li author Liang Cheng author Mark Steedman author Deyi Xiong author 2025-01 text Proceedings of the 31st International Conference on Computational Linguistics Owen Rambow editor Leo Wanner editor Marianna Apidianaki editor Hend Al-Khalifa editor Barbara Di Eugenio editor Steven Schockaert editor Association for Computational Linguistics Abu Dhabi, UAE conference publication liu-etal-2025-empirical https://aclanthology.org/2025.coling-main.403/ 2025-01 6024 6038