VisCoder: Fine-Tuning LLMs for Executable Python Visualization Code Generation

Yuansheng Ni; Ping Nie; Kai Zou; Xiang Yue; Wenhu Chen

doi:10.18653/v1/2025.findings-emnlp.160

VisCoder: Fine-Tuning LLMs for Executable Python Visualization Code Generation

Yuansheng Ni, Ping Nie, Kai Zou, Xiang Yue, Wenhu Chen

Abstract

Large language models (LLMs) often struggle with visualization tasks like plotting diagrams, charts, where success depends on both code correctness and visual semantics. Existing instruction-tuning datasets lack execution-grounded supervision and offer limited support for iterative code correction, resulting in fragile and unreliable plot generation. We present **VisCode-200K**, a large-scale instruction tuning dataset for Python-based visualization and self-correction. It contains over 200K examples from two sources: (1) validated plotting code from open-source repositories, paired with natural language instructions and rendered plots; and (2) 45K multi-turn correction dialogues from Code-Feedback, enabling models to revise faulty code using runtime feedback. We fine-tune Qwen2.5-Coder-Instruct on VisCode-200K to create **VisCoder**, and evaluate it on PandasPlotBench. VisCoder significantly outperforms strong open-source baselines and approaches the performance of proprietary models like GPT-4o-mini. We further adopt a self-debug evaluation protocol to assess iterative repair, demonstrating the benefits of feedback-driven learning for executable, visually accurate code generation.

Anthology ID:: 2025.findings-emnlp.160
Volume:: Findings of the Association for Computational Linguistics: EMNLP 2025
Month:: November
Year:: 2025
Address:: Suzhou, China
Editors:: Christos Christodoulopoulos, Tanmoy Chakraborty, Carolyn Rose, Violet Peng
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 2956–2983
Language:
URL:: https://aclanthology.org/2025.findings-emnlp.160/
DOI:: 10.18653/v1/2025.findings-emnlp.160
Bibkey:
Cite (ACL):: Yuansheng Ni, Ping Nie, Kai Zou, Xiang Yue, and Wenhu Chen. 2025. VisCoder: Fine-Tuning LLMs for Executable Python Visualization Code Generation. In Findings of the Association for Computational Linguistics: EMNLP 2025, pages 2956–2983, Suzhou, China. Association for Computational Linguistics.
Cite (Informal):: VisCoder: Fine-Tuning LLMs for Executable Python Visualization Code Generation (Ni et al., Findings 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.findings-emnlp.160.pdf
Checklist:: 2025.findings-emnlp.160.checklist.pdf

PDF Cite Search Checklist Fix data