RUC Team at SemEval-2025 Task 5: Fast Automated Subject Indexing: A Method Based on Similar Records Matching and Related Subject Ranking

Xia Tian; Yang Xin; Wu Jing; Xiu Heng; Zhang Xin; Li Yu; Gao Tong; Tan Xi; Hu Dong; Chen Tao; Jia Zhi

RUC Team at SemEval-2025 Task 5: Fast Automated Subject Indexing: A Method Based on Similar Records Matching and Related Subject Ranking

Xia Tian, Yang Xin, Wu Jing, Xiu Heng, Zhang Xin, Li Yu, Gao Tong, Tan Xi, Hu Dong, Chen Tao, Jia Zhi

Abstract

This paper presents MaRSI, an automatic subject indexing method designed to address the limitations of traditional manual indexing and emerging GenAI technologies. Focusing on improving indexing accuracy in cross-lingual contexts and balancing efficiency and accuracy in large-scale datasets, MaRSI mimics human reference learning behavior by constructing semantic indexes from pre-indexed document. It calculates similarity to retrieve relevant references, merges, and reorders their topics to generate index results. Experiments demonstrate that MaRSI outperforms supervised fine-tuning of LLMs on the same dataset, offering advantages in speed, effectiveness, and interpretability.

Anthology ID:: 2025.semeval-1.317
Volume:: Proceedings of the 19th International Workshop on Semantic Evaluation (SemEval-2025)
Month:: July
Year:: 2025
Address:: Vienna, Austria
Editors:: Sara Rosenthal, Aiala Rosá, Debanjan Ghosh, Marcos Zampieri
Venues:: SemEval | WS
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 2437–2442
Language:
URL:: https://aclanthology.org/2025.semeval-1.317/
DOI:
Bibkey:
Cite (ACL):: Xia Tian, Yang Xin, Wu Jing, Xiu Heng, Zhang Xin, Li Yu, Gao Tong, Tan Xi, Hu Dong, Chen Tao, and Jia Zhi. 2025. RUC Team at SemEval-2025 Task 5: Fast Automated Subject Indexing: A Method Based on Similar Records Matching and Related Subject Ranking. In Proceedings of the 19th International Workshop on Semantic Evaluation (SemEval-2025), pages 2437–2442, Vienna, Austria. Association for Computational Linguistics.
Cite (Informal):: RUC Team at SemEval-2025 Task 5: Fast Automated Subject Indexing: A Method Based on Similar Records Matching and Related Subject Ranking (Tian et al., SemEval 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.semeval-1.317.pdf

PDF Cite Search Fix data