Diffusion Directed Acyclic Transformer for Non-Autoregressive Machine Translation

Quan Nguyen-Tri; Cong Dao Tran; Hoang Thanh-Tung

doi:10.18653/v1/2025.acl-short.64

Diffusion Directed Acyclic Transformer for Non-Autoregressive Machine Translation

Quan Nguyen-Tri, Cong Dao Tran, Hoang Thanh-Tung

Abstract

Non-autoregressive transformers (NATs) predict entire sequences in parallel to reduce decoding latency, but they often encounter performance challenges due to the multi-modality problem. A recent advancement, the Directed Acyclic Transformer (DAT), addresses this issue by capturing multiple translation modalities to paths in a Directed Acyclic Graph (DAG). However, the collaboration with the latent variable introduced through the Glancing training (GLAT) is crucial for DAT to attain state-of-the-art performance. In this paper, we introduce Diffusion Directed Acyclic Transformer (Diff-DAT), which serves as an alternative to GLAT as a latent variable introduction for DAT. Diff-DAT offers two significant benefits over the previous approach. Firstly, it establishes a stronger alignment between training and inference. Secondly, it facilitates a more flexible tradeoff between quality and latency.

Anthology ID:: 2025.acl-short.64
Volume:: Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers)
Month:: July
Year:: 2025
Address:: Vienna, Austria
Editors:: Wanxiang Che, Joyce Nabende, Ekaterina Shutova, Mohammad Taher Pilehvar
Venue:: ACL
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 814–828
Language:
URL:: https://aclanthology.org/2025.acl-short.64/
DOI:: 10.18653/v1/2025.acl-short.64
Bibkey:
Cite (ACL):: Quan Nguyen-Tri, Cong Dao Tran, and Hoang Thanh-Tung. 2025. Diffusion Directed Acyclic Transformer for Non-Autoregressive Machine Translation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), pages 814–828, Vienna, Austria. Association for Computational Linguistics.
Cite (Informal):: Diffusion Directed Acyclic Transformer for Non-Autoregressive Machine Translation (Nguyen-Tri et al., ACL 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.acl-short.64.pdf

PDF Cite Search Fix data