@inproceedings{zheng-chen-rui-etal-2025-ccl25,
title = "{CCL}25-Eval任务7系统报告:学而不思则罔?",
author = "郑陈锐, 郑陈锐 and
朱奕澄, 朱奕澄 and
王欣雨, 王欣雨 and
姜伟麟, 姜伟麟 and
吴会腾, 吴会腾",
editor = "Lin, Hongfei and
Li, Bin and
Tan, Hongye",
booktitle = "Proceedings of the 24th {C}hina National Conference on Computational Linguistics ({CCL} 2025)",
month = aug,
year = "2025",
address = "Jinan, China",
publisher = "Chinese Information Processing Society of China",
url = "https://aclanthology.org/2025.ccl-2.32/",
pages = "271--277",
abstract = "``以DeepSeek-R1为 代 表 ,{''}思 考{''}普 遍 被 认 为 是 一 种 提 高 大 语 言 模 型 性 能 的 方 法 。在CCL25-Eval{''}争鸣{''}中文阅读理解任务下,本文分别探索了{''}思考{''}和{''}非思考{''}两种模型在这项任务下的潜力。具体来说,在古代文学知识理解任务中,本文构建了古汉语特定领域的知识数据集,用大模型蒸馏了思考数据集,整理了高质量思考数据集,在这些数据基础之下同样lora微调,发现思考模型虽然性能有巨大提升,但依旧比不上原本的非思考模型。最后,开源并提交了基于Qwen2.5的SongPanda模型。''"
}<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="zheng-chen-rui-etal-2025-ccl25">
<titleInfo>
<title>CCL25-Eval任务7系统报告:学而不思则罔?</title>
</titleInfo>
<name type="personal">
<namePart type="given">郑陈锐</namePart>
<namePart type="family">郑陈锐</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">朱奕澄</namePart>
<namePart type="family">朱奕澄</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">王欣雨</namePart>
<namePart type="family">王欣雨</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">姜伟麟</namePart>
<namePart type="family">姜伟麟</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">吴会腾</namePart>
<namePart type="family">吴会腾</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-08</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<relatedItem type="host">
<titleInfo>
<title>Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Hongfei</namePart>
<namePart type="family">Lin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Bin</namePart>
<namePart type="family">Li</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Hongye</namePart>
<namePart type="family">Tan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>Chinese Information Processing Society of China</publisher>
<place>
<placeTerm type="text">Jinan, China</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>“以DeepSeek-R1为 代 表 ,”思 考”普 遍 被 认 为 是 一 种 提 高 大 语 言 模 型 性 能 的 方 法 。在CCL25-Eval”争鸣”中文阅读理解任务下,本文分别探索了”思考”和”非思考”两种模型在这项任务下的潜力。具体来说,在古代文学知识理解任务中,本文构建了古汉语特定领域的知识数据集,用大模型蒸馏了思考数据集,整理了高质量思考数据集,在这些数据基础之下同样lora微调,发现思考模型虽然性能有巨大提升,但依旧比不上原本的非思考模型。最后,开源并提交了基于Qwen2.5的SongPanda模型。”</abstract>
<identifier type="citekey">zheng-chen-rui-etal-2025-ccl25</identifier>
<location>
<url>https://aclanthology.org/2025.ccl-2.32/</url>
</location>
<part>
<date>2025-08</date>
<extent unit="page">
<start>271</start>
<end>277</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T CCL25-Eval任务7系统报告:学而不思则罔?
%A 郑陈锐, 郑陈锐
%A 朱奕澄, 朱奕澄
%A 王欣雨, 王欣雨
%A 姜伟麟, 姜伟麟
%A 吴会腾, 吴会腾
%Y Lin, Hongfei
%Y Li, Bin
%Y Tan, Hongye
%S Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
%D 2025
%8 August
%I Chinese Information Processing Society of China
%C Jinan, China
%F zheng-chen-rui-etal-2025-ccl25
%X “以DeepSeek-R1为 代 表 ,”思 考”普 遍 被 认 为 是 一 种 提 高 大 语 言 模 型 性 能 的 方 法 。在CCL25-Eval”争鸣”中文阅读理解任务下,本文分别探索了”思考”和”非思考”两种模型在这项任务下的潜力。具体来说,在古代文学知识理解任务中,本文构建了古汉语特定领域的知识数据集,用大模型蒸馏了思考数据集,整理了高质量思考数据集,在这些数据基础之下同样lora微调,发现思考模型虽然性能有巨大提升,但依旧比不上原本的非思考模型。最后,开源并提交了基于Qwen2.5的SongPanda模型。”
%U https://aclanthology.org/2025.ccl-2.32/
%P 271-277
Markdown (Informal)
[CCL25-Eval任务7系统报告:学而不思则罔?](https://aclanthology.org/2025.ccl-2.32/) (郑陈锐 et al., CCL 2025)
ACL
- 郑陈锐 郑陈锐, 朱奕澄 朱奕澄, 王欣雨 王欣雨, 姜伟麟 姜伟麟, and 吴会腾 吴会腾. 2025. CCL25-Eval任务7系统报告:学而不思则罔?. In Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025), pages 271–277, Jinan, China. Chinese Information Processing Society of China.