姜伟麟 姜伟麟


2025

"以DeepSeek-R1为 代 表 ,"思 考"普 遍 被 认 为 是 一 种 提 高 大 语 言 模 型 性 能 的 方 法 。在CCL25-Eval"争鸣"中文阅读理解任务下,本文分别探索了"思考"和"非思考"两种模型在这项任务下的潜力。具体来说,在古代文学知识理解任务中,本文构建了古汉语特定领域的知识数据集,用大模型蒸馏了思考数据集,整理了高质量思考数据集,在这些数据基础之下同样lora微调,发现思考模型虽然性能有巨大提升,但依旧比不上原本的非思考模型。最后,开源并提交了基于Qwen2.5的SongPanda模型。"