基于文本风格迁移的中文性别歧视文本去毒研究(Research on detoxification of Chinese sexist texts based on text style transfer)

Peng Jian (彭健), Zuo Jiali (左家莉), Tan Jingxuan (谭景璇), Wan Jianyi (万剑怡), Wang Mingwen (王明文)


Abstract
“网络社交媒体平台存在一定程度的性别歧视言论,阻碍了互联网健康和社会文明发展。文本风格迁移技术可以减轻文本中的性别歧视,在英语等语言上已有不少研究。但在中文领域,由于缺乏数据集而导致相关研究较少。此外,由于中文语义信息丰富、语言表达多样而导致性别歧视言论毒性的表现形式多样,现有的方法多采用单一文本风格迁移模型因而效果不佳。因此,本文提出了一个基于文本风格迁移的中文性别歧视文本去毒框架,该框架首先根据毒性的表现形式对文本进行分类,进而根据文本毒性表现形式的不同采用不同的处理方式,我们还引入了大语言模型(LLM)构建歧视词词典。实验表明,本文提出的模型能有效地处理中文文本中的性别歧视问题。”
Anthology ID:
2024.ccl-1.47
Volume:
Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 1: Main Conference)
Month:
July
Year:
2024
Address:
Taiyuan, China
Editors:
Maosong Sun, Jiye Liang, Xianpei Han, Zhiyuan Liu, Yulan He
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
600–612
Language:
Chinese
URL:
https://aclanthology.org/2024.ccl-1.47/
DOI:
Bibkey:
Cite (ACL):
Peng Jian, Zuo Jiali, Tan Jingxuan, Wan Jianyi, and Wang Mingwen. 2024. 基于文本风格迁移的中文性别歧视文本去毒研究(Research on detoxification of Chinese sexist texts based on text style transfer). In Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 1: Main Conference), pages 600–612, Taiyuan, China. Chinese Information Processing Society of China.
Cite (Informal):
基于文本风格迁移的中文性别歧视文本去毒研究(Research on detoxification of Chinese sexist texts based on text style transfer) (Jian et al., CCL 2024)
Copy Citation:
PDF:
https://aclanthology.org/2024.ccl-1.47.pdf