Yue Ji
2025
大语言模型可以分析花园幽径句吗?—基于跨语言数据集的实证研究
李琦 李琦 | Yue Ji | Hongzheng Li
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
李琦 李琦 | Yue Ji | Hongzheng Li
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
"花园幽径句是在句法或语义上存在局部或临时歧义的一类特殊句子,在汉语和英语中都普遍存在,对于语言处理和认知机制等研究具有重要价值。本文聚焦于大语言模型理解分析花园幽径句的能力。本研究首先构建了一个具有典型结构的英汉双语花园幽径句数据集。随后基于该数据集开展了跨语言、跨模型的句法结构分析及语义理解的对比实验,考察多个大语言模型处理不同语言花园幽径句的消歧和理解分析能力,并对比了大模型与传统句法分析器Stanford Parser模型的分析能力。实验结果显示大语言模型测试结果呈现出与人类认知相似的花园幽径效应,可以利用名词合理性及动词偏向性为线索辅助消除句子歧义,英语句子的消歧能力显著优于汉语。语言模型句法分析与语义分析准确率具有较大差异。本实证研究揭示了大语言模型处理不同条件歧义句的表现差异,为语言处理和认知机制等提供了新的计算视角证据。"