Socratic Human Feedback (SoHF): Expert Steering Strategies for LLM Code Generation

Subramanian Chidambaram; Li Erran Li; Min Bai; Xiaopeng Li; Kaixiang Lin; Xiong Zhou; Alex C. Williams

doi:10.18653/v1/2024.findings-emnlp.908

Socratic Human Feedback (SoHF): Expert Steering Strategies for LLM Code Generation

Subramanian Chidambaram, Li Erran Li, Min Bai, Xiaopeng Li, Kaixiang Lin, Xiong Zhou, Alex C. Williams

Abstract

Large Language Models (LLMs) are increasingly used for generating code solutions, empowered by features like self-debugging and self-reflection. However, LLMs often struggle with complex programming problems without human guidance. This paper investigates the strategies employed by expert programmers to steer code-generating LLMs toward successful outcomes. Through a study involving experts using natural language to guide GPT-4, Gemini Ultra, and, Claude 3.5 Sonnet on highly difficult programming challenges, we frame our analysis using the “Socratic Feedback” paradigm for understanding effective steering strategies. By analyzing 30 conversational transcripts across all three models, we map observed feedback strategies to five stages of Socratic Questioning: Definition, Elenhus, Maieutic, Dialectic, and Counter-factual reasoning. We find evidence that by employing a combination of different Socratic feedback strategies across multiple turns, programmers successfully guided the models to solve 74% of the problems that the models initially failed to solve on their own.

Anthology ID:: 2024.findings-emnlp.908
Volume:: Findings of the Association for Computational Linguistics: EMNLP 2024
Month:: November
Year:: 2024
Address:: Miami, Florida, USA
Editors:: Yaser Al-Onaizan, Mohit Bansal, Yun-Nung Chen
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 15491–15502
Language:
URL:: https://aclanthology.org/2024.findings-emnlp.908/
DOI:: 10.18653/v1/2024.findings-emnlp.908
Bibkey:
Cite (ACL):: Subramanian Chidambaram, Li Erran Li, Min Bai, Xiaopeng Li, Kaixiang Lin, Xiong Zhou, and Alex C. Williams. 2024. Socratic Human Feedback (SoHF): Expert Steering Strategies for LLM Code Generation. In Findings of the Association for Computational Linguistics: EMNLP 2024, pages 15491–15502, Miami, Florida, USA. Association for Computational Linguistics.
Cite (Informal):: Socratic Human Feedback (SoHF): Expert Steering Strategies for LLM Code Generation (Chidambaram et al., Findings 2024)
Copy Citation:
PDF:: https://aclanthology.org/2024.findings-emnlp.908.pdf

PDF Cite Search Fix data