CuriosAI at SemEval-2026 Task 4: A Comprehensive Study of Zero-Shot versus Fine-Tuned Approaches for Narrative Similarity

Yuki Shibata; Hiroki Takushima; Fumika Beppu; Aiswariya Manoj Kumar; Daichi Yamaga; Takayuki Hori

CuriosAI at SemEval-2026 Task 4: A Comprehensive Study of Zero-Shot versus Fine-Tuned Approaches for Narrative Similarity

Yuki Shibata, Hiroki Takushima, Fumika Beppu, Aiswariya Manoj Kumar, Daichi Yamaga, Takayuki Hori

Abstract

This paper presents our system for SemEval-2026 Task 4 on narrative similarity assessment.Through comprehensive experimentation, we evaluated various approaches including zero-shot pre-trained models, prompt engineering with large language models, and multiple fine-tuning strategies using synthetic data. Our experiments revealed a surprising finding: pre-trained sentence transformers in a zero-shot setting consistently outperformed all fine-tuning attempts. Specifically, our best system using sentence-transformers/sentence-t5-xl achieved 67.5% accuracy on the development set (95% CI: [61.0%, 74.0%]), while all fine-tuning approaches resulted in performance degradation of 2-18 percentage points. We provide a detailed analysis of why fine-tuning failed and discuss the implications for narrative similarity tasks.

Anthology ID:: 2026.semeval-1.62
Volume:: Proceedings of the 20th International Workshop on Semantic Evaluation (2026)
Month:: July
Year:: 2026
Address:: San Diego, California, USA
Editors:: Ekaterina Kochmar, Debanjan Ghosh, Kai North, Mamoru Komachi
Venues:: SemEval | WS
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 434–439
Language:
URL:: https://aclanthology.org/2026.semeval-1.62/
DOI:
Bibkey:
Cite (ACL):: Yuki Shibata, Hiroki Takushima, Fumika Beppu, Aiswariya Manoj Kumar, Daichi Yamaga, and Takayuki Hori. 2026. CuriosAI at SemEval-2026 Task 4: A Comprehensive Study of Zero-Shot versus Fine-Tuned Approaches for Narrative Similarity. In Proceedings of the 20th International Workshop on Semantic Evaluation (2026), pages 434–439, San Diego, California, USA. Association for Computational Linguistics.
Cite (Informal):: CuriosAI at SemEval-2026 Task 4: A Comprehensive Study of Zero-Shot versus Fine-Tuned Approaches for Narrative Similarity (Shibata et al., SemEval 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.semeval-1.62.pdf
Supplementarymaterial:: 2026.semeval-1.62.SupplementaryMaterial.zip

PDF Cite Search Supplementarymaterial Fix data