Multi-Granularity Fusion Text Semantic Matching Based on WoBERT

Hongchun Yu; Wei Pan; Xing Fan; Hanqi Li

Multi-Granularity Fusion Text Semantic Matching Based on WoBERT

Hongchun Yu, Wei Pan, Xing Fan, Hanqi Li

Abstract

Text semantic matching is crucial in natural language processing, applied in information retrieval, question answering, and recommendation systems. Traditional text-matching methods struggle with semantic nuances in short text. Recent advancements in multi-granularity representation learning have led to increased interest in improving text semantic matching models. We propose a novel multi-granularity fusion model that harnesses WoBERT, a pre-trained language model, to enhance the accuracy of text semantic information capture. Initially, we process text using WoBERT to acquire semantic representations, effectively capturing individual text semantic nuances. Next, we employ a soft attention alignment mechanism, enabling multi-granularity fusions among characters, words, and sentences, thus further improving matching performance. Our approach was evaluated through experiments on common Chinese short text matching datasets, BQ and LCQMC. Results reveal a significant improvement in performance compared to traditional methods, particularly in terms of accuracy.

Anthology ID:: 2024.lrec-main.1027
Volume:: Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)
Month:: May
Year:: 2024
Address:: Torino, Italia
Editors:: Nicoletta Calzolari, Min-Yen Kan, Veronique Hoste, Alessandro Lenci, Sakriani Sakti, Nianwen Xue
Venues:: LREC | COLING
SIG:
Publisher:: ELRA and ICCL
Note:
Pages:: 11766–11775
Language:
URL:: https://aclanthology.org/2024.lrec-main.1027/
DOI:
Bibkey:
Cite (ACL):: Hongchun Yu, Wei Pan, Xing Fan, and Hanqi Li. 2024. Multi-Granularity Fusion Text Semantic Matching Based on WoBERT. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pages 11766–11775, Torino, Italia. ELRA and ICCL.
Cite (Informal):: Multi-Granularity Fusion Text Semantic Matching Based on WoBERT (Yu et al., LREC-COLING 2024)
Copy Citation:
PDF:: https://aclanthology.org/2024.lrec-main.1027.pdf

PDF Cite Search Fix data