Jiali Zuo
Also published as: 家莉 左
2025
HMUM:面向仇恨模因检测的多阶段多模态理解模型
裴淑娟 裴淑娟 | Jiali Zuo | Le He | Jianyi Wan | Mingwen Wang
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
裴淑娟 裴淑娟 | Jiali Zuo | Le He | Jianyi Wan | Mingwen Wang
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
"随着社交媒体的广泛普及,模因(meme)已成为信息传播与舆论引导的重要载体,其中蕴含的仇恨内容对网络生态与公共安全构成威胁,尤其是通过图像暗示、文化隐喻或社会符号等方式表达的隐性仇恨模因,具有更强的隐蔽性与误导性,给仇恨模因检测任务带来显著挑战。针对上述问题,本文提出了一种仇恨模因理解模型(Hateful Meme Understanding Model,HMUM),在Qwen2.5-VL-72B-Instruct模型基础上引入LoRA微调,并设计了一种多模态多阶段的提示学习框架。该框架通过阶段性引导模型依次完成文本识别、情绪建模与仇恨性推理,逐步增强其对模因语义与情感的理解能力,从而有效提升模型在中文语境下检测语义隐晦、情绪复杂仇恨模因的准确性。在公开数据集ToxiCN MM上的实验结果表明,HMUM(Qwen)在整体任务中取得了显著性能提升,在隐性仇恨模因子集检测方面,相较于基线模型表现出更强的优势。为评估其在更广泛隐性场景中的检测能力,本文构建了以隐性仇恨模因为主的数据集ITTD-220,实验结果显示,HMUM(Qwen)在该数据集上的检测性能同样优于现有模型,验证了其出色的泛化能力。"
2024
基于增量预训练与外部知识的古文历史事件检测
Wenjun Kang (康文军) | Jiali Zuo (左家莉) | Yiyu Hu (胡益裕) | Mingwen Wang (王明文)
Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 3: Evaluations)
Wenjun Kang (康文军) | Jiali Zuo (左家莉) | Yiyu Hu (胡益裕) | Mingwen Wang (王明文)
Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 3: Evaluations)
“古文历史事件检测任务旨在识别文本中的事件触发词和类型。为了解决传统pipeline方法容易产生级联错误传播,以及大多数事件检测方法仅依赖句子层面信息的问题,本文提出了一种结合外部信息和全局对应矩阵的联合抽取模型EIGC,以实现触发词和事件类型的精确抽取。此外,本文还整理了一个包含“二十四史”等古汉语文献的数据集,共计约97万条古汉语文本,并利用该文本对BERT-Ancient-Chinese进行增量预训练。最终,本文所提出的模型在三个任务上的总F1值达到了76.2%,验证了该方法的有效性。”
基于文本风格迁移的中文性别歧视文本去毒研究(Research on detoxification of Chinese sexist texts based on text style transfer)
Jian Peng (彭健) | Jiali Zuo (左家莉) | Jingxuan Tan (谭景璇) | Jianyi Wan (万剑怡) | Mingwen Wang (王明文)
Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 1: Main Conference)
Jian Peng (彭健) | Jiali Zuo (左家莉) | Jingxuan Tan (谭景璇) | Jianyi Wan (万剑怡) | Mingwen Wang (王明文)
Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 1: Main Conference)
“网络社交媒体平台存在一定程度的性别歧视言论,阻碍了互联网健康和社会文明发展。文本风格迁移技术可以减轻文本中的性别歧视,在英语等语言上已有不少研究。但在中文领域,由于缺乏数据集而导致相关研究较少。此外,由于中文语义信息丰富、语言表达多样而导致性别歧视言论毒性的表现形式多样,现有的方法多采用单一文本风格迁移模型因而效果不佳。因此,本文提出了一个基于文本风格迁移的中文性别歧视文本去毒框架,该框架首先根据毒性的表现形式对文本进行分类,进而根据文本毒性表现形式的不同采用不同的处理方式,我们还引入了大语言模型(LLM)构建歧视词词典。实验表明,本文提出的模型能有效地处理中文文本中的性别歧视问题。”
2023
融合词典信息的古籍命名实体识别研究(A Study on the Recognition of Named Entities of Ancient Books Using Lexical Information)
Wenjun Kang (康文军) | Jiali Zuo (左家莉) | Anquan Jie (揭安全) | Wenbin Luo (罗文兵) | Mingwen Wang (王明文)
Proceedings of the 22nd Chinese National Conference on Computational Linguistics
Wenjun Kang (康文军) | Jiali Zuo (左家莉) | Anquan Jie (揭安全) | Wenbin Luo (罗文兵) | Mingwen Wang (王明文)
Proceedings of the 22nd Chinese National Conference on Computational Linguistics
“古籍命名实体识别对于古籍实体知识库与语料库的建设具有显著的现实意义。目前古籍命名实体识别的研究较少,主要原因是缺乏足够的训练语料。本文从《资治通鉴》入手,人工构建了一份古籍命名实体识别数据集,以此展开对古籍命名实体识别任务的研究。针对古籍文本多以单字表意且存在大量省略的语言特点,本文采用预训练词向量作为词典信息,充分利用其中蕴涵的词汇信息。实验表明,这种方法可以有效处理古籍文本中人名实体识别的问题。”
结合全局对应矩阵和相对位置信息的古汉语实体关系联合抽取(Joint Extraction of Ancient Chinese Entity Relations by Combining Global Correspondence Matrix and Relative Position Information)
Yiyu Hu (胡益裕) | Jiali Zuo (左家莉) | Xueqiang Ceng (曾雪强) | Zhongying Wan (万中英) | Mingwen Wang (王明文)
Proceedings of the 22nd Chinese National Conference on Computational Linguistics
Yiyu Hu (胡益裕) | Jiali Zuo (左家莉) | Xueqiang Ceng (曾雪强) | Zhongying Wan (万中英) | Mingwen Wang (王明文)
Proceedings of the 22nd Chinese National Conference on Computational Linguistics
“实体关系抽取是信息抽取领域中一项重要任务,目前实体关系抽取任务主要聚焦于英文和现代汉语领域,关于古汉语领域的数据集构建和方法的研究目前却较少。针对这一问题,本文在研究了开源的《资治通鉴》语料后,人工构建了一个古汉语实体关系数据集,并设计了一种结合全局对应矩阵和相对位置信息的实体关系联合抽取方法。最后通过在本文构建的数据集上进行实验,证明了该方法在古汉语实体关系抽取任务上的有效性。”