Controlled Text Generation for Data Augmentation in Intelligent Artificial Agents

Nikolaos Malandrakis; Minmin Shen; Anuj Goyal; Shuyang Gao; Abhishek Sethi; Angeliki Metallinou

doi:10.18653/v1/D19-5609

Controlled Text Generation for Data Augmentation in Intelligent Artificial Agents

Nikolaos Malandrakis, Minmin Shen, Anuj Goyal, Shuyang Gao, Abhishek Sethi, Angeliki Metallinou

Abstract

Data availability is a bottleneck during early stages of development of new capabilities for intelligent artificial agents. We investigate the use of text generation techniques to augment the training data of a popular commercial artificial agent across categories of functionality, with the goal of faster development of new functionality. We explore a variety of encoder-decoder generative models for synthetic training data generation and propose using conditional variational auto-encoders. Our approach requires only direct optimization, works well with limited data and significantly outperforms the previous controlled text generation techniques. Further, the generated data are used as additional training samples in an extrinsic intent classification task, leading to improved performance by up to 5% absolute f-score in low-resource cases, validating the usefulness of our approach.

Anthology ID:: D19-5609
Volume:: Proceedings of the 3rd Workshop on Neural Generation and Translation
Month:: November
Year:: 2019
Address:: Hong Kong
Editors:: Alexandra Birch, Andrew Finch, Hiroaki Hayashi, Ioannis Konstas, Thang Luong, Graham Neubig, Yusuke Oda, Katsuhito Sudoh
Venue:: NGT
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 90–98
Language:
URL:: https://aclanthology.org/D19-5609/
DOI:: 10.18653/v1/D19-5609
Bibkey:
Cite (ACL):: Nikolaos Malandrakis, Minmin Shen, Anuj Goyal, Shuyang Gao, Abhishek Sethi, and Angeliki Metallinou. 2019. Controlled Text Generation for Data Augmentation in Intelligent Artificial Agents. In Proceedings of the 3rd Workshop on Neural Generation and Translation, pages 90–98, Hong Kong. Association for Computational Linguistics.
Cite (Informal):: Controlled Text Generation for Data Augmentation in Intelligent Artificial Agents (Malandrakis et al., NGT 2019)
Copy Citation:
PDF:: https://aclanthology.org/D19-5609.pdf

PDF Cite Search Fix data