Zhishan Qiao


2025

"本文针对中文语音实体关系三元组抽取任务,提出了一种基于语音识别模型与大语言模型相结合的Pipeline解决方案。该方法首先利用SenseVoice语音识别模型将语音转换为文本,通过热词检测与拼音相似度匹配技术对转录文本进行纠错优化,然后采用微调后的Qwen2.5-7B-Instruct进行实体关系三元组抽取。在数据预处理阶段,我们设计了一套完整的流水线,包括:(1)基于HanLP的命名实体识别构建热词库;(2)拼音相似度匹配算法进行音近字纠错;(3)阿拉伯数字到中文数字的转换;(4)热词引导的语音识别优化。在模型训练方面,我们构建了高质量的指令微调数据集,采用统一的prompt模板对大语言模型进行监督微调,使其能够从语音转录文本中准确提取结构化的三元组信息。实验结果表明,我们的方法在中文语音实体关系三元组抽取任务上取得了良好的性能。热词引导机制显著提升了语音识别在专有名词上的准确率,拼音相似度匹配有效解决了语音识别中的同音字错误问题,基于大语言模型的三元组抽取模块则展现出优秀的泛化能力和推理性能。"
Search
Co-authors
    Venues
    Fix author