Guiyang Ji


2025

"检 索 增 强 生 成 (Retrieval-Augmented Generation,RAG) 是 一 种 有 效 优 化 大 语 言模 型 在 工 艺 规 范 问 答 任 务 中 性 能 的 方 法 。 然 而 , 基 于 固 定 文 本 长 度 分 块 的 朴素RAG(Naive RAG)在构建工艺规范问答任务时表现不佳。主要原因在于工艺规范是一类复杂的技术文档,采用固定文本长度分块会丢失工艺规范段落层级之间的结构关系以及隐含的知识关联关系,导致输出结果质量下降。因此,本文提出了一种利用工艺规范篇章段落间隐含的树结构关系来构建RAG的方法,该方法有效解决了固定文本长度分块导致的段落之间的知识关联丢失问题。实验结果表明,树结构RAG在评价指标上优于朴素RAG,其中ACC平均提升3.81%,ROUGE-L提升3.28%,BLEU-4提升2.97%,验证了树结构RAG的有效性。"