基于样本设计工程和大模型微调的中文意合图语义解析∗

Si Han (司函), Luo Zhiyong (罗智勇)


Abstract
“本文介绍了我们在第二十三届中国计算语言学大会中文意合图语义解析评测中提交的参赛系统。中文意合图(Chinese Parataxis Graph,CPG)是以事件为中心的语义表征图,可以对不同层级的语言单元作一贯式表示,是一种通用性与扩展性兼具的语义表征方法。鉴于大语言模型在语义解析任务中的优越性能,我们对Llama3-Chinese-8B-Instruct模型进行了LoRA微调,使其能够生成结构化的意合图表征三元组,并采用了样本设计工程(Sample Design Engineering,SDE)技巧进行微调样本的设计。此外,我们还对不同标签进行了分类微调,探究大模型在不同语义标签预测能力上的差异。最终,我们的参赛系统在任务发布的评测集上F1值达到0.6461,在本次评测任务中获得了第三名的成绩。”
Anthology ID:
2024.ccl-3.8
Volume:
Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 3: Evaluations)
Month:
July
Year:
2024
Address:
Taiyuan, China
Editors:
Hongfei Lin, Hongye Tan, Bin Li
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
72–79
Language:
Chinese
URL:
https://aclanthology.org/2024.ccl-3.8/
DOI:
Bibkey:
Cite (ACL):
Si Han and Luo Zhiyong. 2024. 基于样本设计工程和大模型微调的中文意合图语义解析∗. In Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 3: Evaluations), pages 72–79, Taiyuan, China. Chinese Information Processing Society of China.
Cite (Informal):
基于样本设计工程和大模型微调的中文意合图语义解析∗ (Han & Zhiyong, CCL 2024)
Copy Citation:
PDF:
https://aclanthology.org/2024.ccl-3.8.pdf