Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs

Fanny Ducel, Aurélie Névéol, Karën Fort


Abstract
Nous proposons un outil pour mesurer automatiquement les biais de genre dans des textes générés par des grands modèles de langue dans des langues flexionnelles. Nous évaluons sept modèles à l’aide de 52 000 textes en français et 2 500 textes en italien, pour la rédaction de lettres de motivation. Notre outil s’appuie sur la détection de marqueurs morpho-syntaxiques de genre pour mettre au jour des biais. Ainsi, les modèles favorisent largement la génération de masculin : le genre masculin est deux fois plus présent que le féminin en français, et huit fois plus en italien. Les modèles étudiés exacerbent également des stéréotypes attestés en sociologie en associant les professions stéréotypiquement féminines aux textes au féminin, et les professions stéréotypiquement masculines aux textes au masculin.
Anthology ID:
2024.jeptalnrecital-taln.5
Volume:
Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position
Month:
7
Year:
2024
Address:
Toulouse, France
Editors:
Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-dac, Julie Mauclair, Jose G Moreno, Julien Pinquier
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA and AFPC
Note:
Pages:
64–84
Language:
French
URL:
https://aclanthology.org/2024.jeptalnrecital-taln.5
DOI:
Bibkey:
Cite (ACL):
Fanny Ducel, Aurélie Névéol, and Karën Fort. 2024. Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs. In Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position, pages 64–84, Toulouse, France. ATALA and AFPC.
Cite (Informal):
Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs (Ducel et al., JEP/TALN/RECITAL 2024)
Copy Citation:
PDF:
https://aclanthology.org/2024.jeptalnrecital-taln.5.pdf