Where Did It Go Wrong? Capability-Oriented Failure Attribution for Vision-and-Language Navigation Agents

Jianming Chen; Yawen Wang; Junjie Wang; Xiaofei Xie; Shoubin Li; Qing Wang; Fanjiang Xu

Where Did It Go Wrong? Capability-Oriented Failure Attribution for Vision-and-Language Navigation Agents

Jianming Chen, Yawen Wang, Junjie Wang, Xiaofei Xie, Shoubin Li, Qing Wang, Fanjiang Xu

Abstract

Embodied agents in safety-critical applications such as Vision-Language Navigation (VLN) rely on multiple interdependent capabilities (e.g., perception, memory, planning, decision), making failures difficult to localize and attribute. Existing testing methods are largely system-level and provide limited insight into which capability deficiencies cause task failures. We propose a capability-oriented testing approach that enables failure detection and attribution by combining (1) adaptive test case generation via seed selection and mutation, (2) capability oracles for identifying capability-specific errors, and (3) a feedback mechanism that attributes failures to capabilities and guides further test generation. Experiments show that our method discovers more failure cases and more accurately pinpoints capability-level deficiencies than state-of-the-art baselines, providing more interpretable and actionable guidance for improving embodied agents.

Anthology ID:: 2026.findings-acl.1402
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 28132–28150
Language:
URL:: https://aclanthology.org/2026.findings-acl.1402/
DOI:
Bibkey:
Cite (ACL):: Jianming Chen, Yawen Wang, Junjie Wang, Xiaofei Xie, Shoubin Li, Qing Wang, and Fanjiang Xu. 2026. Where Did It Go Wrong? Capability-Oriented Failure Attribution for Vision-and-Language Navigation Agents. In Findings of the Association for Computational Linguistics: ACL 2026, pages 28132–28150, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Where Did It Go Wrong? Capability-Oriented Failure Attribution for Vision-and-Language Navigation Agents (Chen et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1402.pdf
Checklist:: 2026.findings-acl.1402.checklist.pdf

PDF Cite Search Checklist Fix data