基于风格化嵌入的中文文本风格迁移(Chinese text style transfer based on stylized embedding)

Chenguang Wang (王晨光), Hongfei Lin (林鸿飞), Liang Yang (杨亮)


Abstract
对话风格能够反映对话者的属性,例如情感、性别和教育背景等。在对话系统中,通过理解用户的对话风格,能够更好地对用户进行建模。同样的,面对不同背景的用户,对话机器人也应该使用不同的语言风格与之交流。语言表达风格是文本的内在属性,然而现有的大多数文本风格迁移研究,集中在英文领域,在中文领域则研究较少。本文构建了三个可用于中文文本风格迁移研究的数据集,并将多种已有的文本风格迁移方法应用于该数据集。同时,本文提出了基于DeepStyle算法与Transformer的风格迁移模型,通过预训练可以获得不同风格的隐层向量表示。并基于Transformer构建生成端模型,在解码阶段,通过重建源文本的方式,保留生成文本的内容信息,并且引入对立风格的嵌入表示,使得模型能够生成不同风格的文本。实验结果表明,本文提出的模型在构建的中文数据集上均优于现有模型。
Anthology ID:
2021.ccl-1.26
Volume:
Proceedings of the 20th Chinese National Conference on Computational Linguistics
Month:
August
Year:
2021
Address:
Huhhot, China
Editors:
Sheng Li (李生), Maosong Sun (孙茂松), Yang Liu (刘洋), Hua Wu (吴华), Kang Liu (刘康), Wanxiang Che (车万翔), Shizhu He (何世柱), Gaoqi Rao (饶高琦)
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
269–279
Language:
Chinese
URL:
https://aclanthology.org/2021.ccl-1.26
DOI:
Bibkey:
Cite (ACL):
Chenguang Wang, Hongfei Lin, and Liang Yang. 2021. 基于风格化嵌入的中文文本风格迁移(Chinese text style transfer based on stylized embedding). In Proceedings of the 20th Chinese National Conference on Computational Linguistics, pages 269–279, Huhhot, China. Chinese Information Processing Society of China.
Cite (Informal):
基于风格化嵌入的中文文本风格迁移(Chinese text style transfer based on stylized embedding) (Wang et al., CCL 2021)
Copy Citation:
PDF:
https://aclanthology.org/2021.ccl-1.26.pdf