基于互信息最大化和对比损失的多模态对话情绪识别模型(Multimodal Emotion Recognition in Conversation with Mutual Information Maximization and Contrastive Loss)

Qianer Li (黎倩尔), Peijie Huang (黄沛杰), Jiawei Chen (陈佳炜), Jialin Wu (吴嘉林), Yuhong Xu (徐禹洪), Peiyuan Lin (林丕源)


Abstract
“多模态的对话情绪识别(emotion recognition in conversation,ERC)是构建情感对话系统的关键。近年来基于图的融合方法在会话中动态聚合多模态上下文特征,提高了模型在多模态对话情绪识别方面的性能。然而,这些方法都没有充分保留和利用输入数据中的有价值的信息。具体地说,它们都没有保留从输入到融合结果的任务相关信息,并且忽略了标签本身蕴含的信息。本文提出了一种基于互信息最大化和对比损失的多模态对话情绪识别模型MMIC来解决上述的问题。模型通过在输入级和融合级上分级最大化模态之间的互信息(mutual information),使任务相关信息在融合过程中得以保存,从而生成更丰富的多模态表示。本文还在基于图的动态融合网络中引入了监督对比学习(supervised contrastive learning),通过充分利用标签蕴含的信息,使不同情绪相互排斥,增强了模型识别相似情绪的能力。在两个英文和一个中文的公共数据集上的大量实验证明了所提出模型的有效性和优越性。此外,在所提出模型上进行的案例探究有效地证实了模型可以有效保留任务相关信息,更好地区分出相似的情绪。消融实验和可视化结果证明了模型中每个模块的有效性。”
Anthology ID:
2023.ccl-1.24
Volume:
Proceedings of the 22nd Chinese National Conference on Computational Linguistics
Month:
August
Year:
2023
Address:
Harbin, China
Editors:
Maosong Sun, Bing Qin, Xipeng Qiu, Jing Jiang, Xianpei Han
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
264–276
Language:
Chinese
URL:
https://aclanthology.org/2023.ccl-1.24
DOI:
Bibkey:
Cite (ACL):
Qianer Li, Peijie Huang, Jiawei Chen, Jialin Wu, Yuhong Xu, and Peiyuan Lin. 2023. 基于互信息最大化和对比损失的多模态对话情绪识别模型(Multimodal Emotion Recognition in Conversation with Mutual Information Maximization and Contrastive Loss). In Proceedings of the 22nd Chinese National Conference on Computational Linguistics, pages 264–276, Harbin, China. Chinese Information Processing Society of China.
Cite (Informal):
基于互信息最大化和对比损失的多模态对话情绪识别模型(Multimodal Emotion Recognition in Conversation with Mutual Information Maximization and Contrastive Loss) (Li et al., CCL 2023)
Copy Citation:
PDF:
https://aclanthology.org/2023.ccl-1.24.pdf