Un traitement hybride du vague textuel : du système expert VAGO à son clone neuronal

Benjamin Icard, Vincent Claveau, Ghislain Atemezing, Paul Egré


Abstract
L’outil VAGO est un système expert de détection du vague lexical qui mesure aussi le degré de subjectivité du discours, ainsi que son niveau de détail. Dans cet article, nous construisons un clone neuronal de VAGO, fondé sur une architecture de type BERT, entraîné à partir des scores du VAGO symbolique sur un corpus de presse française (FreSaDa). L’analyse qualitative et quantitative montre la fidélité de la version neuronale. En exploitant des outils d’explicabilité (LIME), nous montrons ensuite l’intérêt de cette version neuronale d’une part pour l’enrichissement des lexiques de la version symbolique, et d’autre part pour la production de versions dans d’autres langues.
Anthology ID:
2023.jeptalnrecital-long.12
Volume:
Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs
Month:
6
Year:
2023
Address:
Paris, France
Editors:
Christophe Servan, Anne Vilnat
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
151–163
Language:
French
URL:
https://aclanthology.org/2023.jeptalnrecital-long.12
DOI:
Bibkey:
Cite (ACL):
Benjamin Icard, Vincent Claveau, Ghislain Atemezing, and Paul Egré. 2023. Un traitement hybride du vague textuel : du système expert VAGO à son clone neuronal. In Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs, pages 151–163, Paris, France. ATALA.
Cite (Informal):
Un traitement hybride du vague textuel : du système expert VAGO à son clone neuronal (Icard et al., JEP/TALN/RECITAL 2023)
Copy Citation:
PDF:
https://aclanthology.org/2023.jeptalnrecital-long.12.pdf