Memory-Guided Hard Data Augmentation for Multimodal Named Entity Recognition

Xinyu Liu; Kai fu; Yinghan Shi; Quanyou Chu; Ming Du; Hongya Wang; Xiaojun Meng; Jiansheng Wei; Yanghua Xiao; Bo Xu

Memory-Guided Hard Data Augmentation for Multimodal Named Entity Recognition

Xinyu Liu, Kai fu, Yinghan Shi, Quanyou Chu, Ming Du, Hongya Wang, Xiaojun Meng, Jiansheng Wei, Yanghua Xiao, Bo Xu

Abstract

Multimodal Named Entity Recognition relies on visual context to resolve textual ambiguities. To mitigate data scarcity, Data Augmentation (DA) has become a standard practice; however, existing methods predominantly adopt a one-size-fits-all and random perturbation paradigm, ignoring the internal state of the target model. In this paper, we first conduct a quantitative analysis, revealing that a significant portion of errors (over 30%) are model-specific, stemming from the unique biases of different architectures. To address this, we propose Memory-Guided Hard Data Augmentation, a framework designed to systematically repair these specific defects. First, we employ K-fold cross-validation to identify model-specific Hard Data. Second, we construct a Memory Tree and utilize Large Language Models (LLMs) with a clustering mechanism to induce macro-level error patterns from micro-level failures. This facilitates a paradigm shift from stateless instance-driven augmentation to a logical pattern-driven approach. Finally, we introduce an iterative augmentation mechanism that triggers recursive generation for stubborn instances that fail initial quality filters. Extensive experiments on Twitter-2015 and Twitter-2017 benchmarks demonstrate that our framework consistently yields significant performance gains across various MNER backbones.

Anthology ID:: 2026.findings-acl.1075
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 21376–21391
Language:
URL:: https://aclanthology.org/2026.findings-acl.1075/
DOI:
Bibkey:
Cite (ACL):: Xinyu Liu, Kai fu, Yinghan Shi, Quanyou Chu, Ming Du, Hongya Wang, Xiaojun Meng, Jiansheng Wei, Yanghua Xiao, and Bo Xu. 2026. Memory-Guided Hard Data Augmentation for Multimodal Named Entity Recognition. In Findings of the Association for Computational Linguistics: ACL 2026, pages 21376–21391, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Memory-Guided Hard Data Augmentation for Multimodal Named Entity Recognition (Liu et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1075.pdf
Checklist:: 2026.findings-acl.1075.checklist.pdf

PDF Cite Search Checklist Fix data