Hi-ToM: A Benchmark for Evaluating Higher-Order Theory of Mind Reasoning in Large Language Models

Hi-ToM: A Benchmark for Evaluating Higher-Order Theory of Mind Reasoning in Large Language Models Yufan Wu author Yinghui He author Yilin Jia author Rada Mihalcea author Yulong Chen author Naihao Deng author 2023-12 text Findings of the Association for Computational Linguistics: EMNLP 2023 Houda Bouamor editor Juan Pino editor Kalika Bali editor Association for Computational Linguistics Singapore conference publication wu-etal-2023-hi 10.18653/v1/2023.findings-emnlp.717 https://aclanthology.org/2023.findings-emnlp.717/ 2023-12 10691 10706