EXPO-SQL: Execution-based Clause-level Policy Optimization for Text-to-SQL

Jaehoon Lee; CheolWon Na; Suyoung Bae; Jin-Seop Lee; Jihyung Lee; YunSeok Choi; Jee-Hyong Lee

EXPO-SQL: Execution-based Clause-level Policy Optimization for Text-to-SQL

Jaehoon Lee, CheolWon Na, Suyoung Bae, Jin-Seop Lee, Jihyung Lee, YunSeok Choi, Jee-Hyong Lee

Abstract

Text-to-SQL enables users to query databases using natural language by generating executable SQL queries. Recent methods have increasingly adopted Large Language Models based reinforcement learning (RL) to leverage execution feedback for training. However, existing RL methods assign uniform query-level rewards to all clauses in a SQL query, treating correct and incorrect clauses equally. This coarse-grained reward design leads to insufficient learning signals for correct SQL generation. To address this issue, we propose **EXPO-SQL** (**EX**ecution-based clause-level **P**olicy **O**ptimization for Text-to-**SQL**) which provides fine-grained supervision through clause-level rewards. To assign clause-level rewards, our method identifies erroneous clauses by analyzing execution results, including error messages and clause-wise incremental execution. Experiments on widely-used Text-to-SQL benchmarks demonstrate that EXPO-SQL significantly outperforms existing supervised fine-tuning, prompting, and RL-based methods through fine-grained clause-level learning. Our code is available at https://github.com/jhn25/EXPO-SQL.

Anthology ID:: 2026.findings-acl.1107
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 22000–22019
Language:
URL:: https://aclanthology.org/2026.findings-acl.1107/
DOI:
Bibkey:
Cite (ACL):: Jaehoon Lee, CheolWon Na, Suyoung Bae, Jin-Seop Lee, Jihyung Lee, YunSeok Choi, and Jee-Hyong Lee. 2026. EXPO-SQL: Execution-based Clause-level Policy Optimization for Text-to-SQL. In Findings of the Association for Computational Linguistics: ACL 2026, pages 22000–22019, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: EXPO-SQL: Execution-based Clause-level Policy Optimization for Text-to-SQL (Lee et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1107.pdf
Checklist:: 2026.findings-acl.1107.checklist.pdf

PDF Cite Search Checklist Fix data