Yanting Jiang
2025
DeepSeek等大语言模型幽默生成能力及其特征的评测分析
Yanting Jiang | Yizhou Ying
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
Yanting Jiang | Yizhou Ying
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
"以人类的笑话文本为基础,比较评测了4个大语言模型生成幽默笑点句的能力。总的来看,目前DeepSeek-R1的中文幽默生成能力强于GPT-4o、Qwen2.5-7B和Qwen3模型 , 但 距 离 人 类 的 幽 默 能 力 还 有 明 显 的 差 距 。 各 模 型 基 于 固 定 表 达 生 成 笑 点 句时,或多或少存在“思维定势”问题。测查了人类与大语言模型幽默文本的9项语言特征。DeepSeek与人类的相似笑点最多,BLEU-4匹配度也最高。与人类相比,AI生成的笑点句更倾向于使用高频常见的词,未登录词、网络新词的比例更低,在长度上普遍更长。基于Sentence-BERT模型获取语义表示,大模型的笑点句在语义联想距离上普遍比人类的笑点句更短。强化谐音双关、语义双关等修辞手法的运用,是大模型提高幽默文本生成能力的重要途径。最后,我们讨论了本文评价方式的优劣,并展望了增强大模型幽默能力的3个策略:优化提示工程、构建幽默多模态大模型、在推理中增强幽默文本的可解释。"