Impact du français inclusif sur les outils du TAL (Impact of French Inclusive Language on NLP Tools)

Cyril Grouin


Abstract
Le français inclusif est une variété du français standard mise en avant pour témoigner d’une conscience de genre et d’identité. Plusieurs procédés existent pour lutter contre l’utilisation générique du masculin (coordination de formes féminines et masculines, féminisation des fonctions, écriture inclusive, et neutralisation). Dans cette étude, nous nous intéressons aux performances des outils sur quelques tâches du TAL (étiquetage, lemmatisation, repérage d’entités nommées) appliqués sur des productions langagières de ce type. Les taux d’erreur sur l’étiquetage en parties du discours (TreeTagger et spaCy) augmentent de 3 à 7 points sur les portions rédigées en français inclusif par rapport au français standard, sans lemmatisation possible pour le TreeTagger. Sur le repérage d’entités nommées, les modèles sont sensibles aux contextes en français inclusif et font des prédictions erronées, avec une précision en baisse.
Anthology ID:
2022.jeptalnrecital-taln.12
Volume:
Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
Month:
6
Year:
2022
Address:
Avignon, France
Editors:
Yannick Estève, Tania Jiménez, Titouan Parcollet, Marcely Zanon Boito
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
126–135
Language:
French
URL:
https://aclanthology.org/2022.jeptalnrecital-taln.12
DOI:
Bibkey:
Cite (ACL):
Cyril Grouin. 2022. Impact du français inclusif sur les outils du TAL (Impact of French Inclusive Language on NLP Tools). In Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale, pages 126–135, Avignon, France. ATALA.
Cite (Informal):
Impact du français inclusif sur les outils du TAL (Impact of French Inclusive Language on NLP Tools) (Grouin, JEP/TALN/RECITAL 2022)
Copy Citation:
PDF:
https://aclanthology.org/2022.jeptalnrecital-taln.12.pdf