HISTOIRESMORALES: Un jeu de données français pour évaluer l’alignement moral des modèles de langage

Thibaud Leteno; Irina Proskurina; Antoine Gourru; Julien Velcin; Charlotte Laclau; Guillaume Metzler; Christophe Gravier

HISTOIRESMORALES: Un jeu de données français pour évaluer l’alignement moral des modèles de langage

Thibaud Leteno, Irina Proskurina, Antoine Gourru, Julien Velcin, Charlotte Laclau, Guillaume Metzler, Christophe Gravier

Abstract

L’alignement des modèles de langage avec les valeurs humaines est essentiel, à mesure qu’ils s’intègrent dans la vie quotidienne. Ces modèles sont souvent adaptés aux préférences des utilisateurs mais il est important de veiller à ce qu’ils respectent des normes morales en situation réelle. Malgré des avancées dans d’autres langues, le raisonnement moral des modèles en français reste peu étudié. Pour combler cette lacune, nous présentons HistoiresMorales, un jeu de données français dérivé de MoralStories, traduit puis affiné avec des locuteurs natifs pour assurer précision grammaticale et ajustement culturel. Afin de favoriser de futures recherches, nous menons des expériences préliminaires sur l’alignement des modèles multilingues en français et en anglais. Bien que les modèles de langage s’alignent généralement sur les normes morales humaines, nous observons qu’ils restent influençables, tant vers un alignement moral qu’immoral.

Anthology ID:: 2025.jeptalnrecital-trad.16
Volume:: Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publiés
Month:: 6
Year:: 2025
Address:: Marseille, France
Editors:: Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:: JEP/TALN/RECITAL
SIG:
Publisher:: ATALA \\& ARIA
Note:
Pages:: 32
Language:: French
URL:: https://aclanthology.org/2025.jeptalnrecital-trad.16/
DOI:
Bibkey:
Cite (ACL):: Thibaud Leteno, Irina Proskurina, Antoine Gourru, Julien Velcin, Charlotte Laclau, Guillaume Metzler, and Christophe Gravier. 2025. HISTOIRESMORALES: Un jeu de données français pour évaluer l’alignement moral des modèles de langage. In Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publiés, pages 32–32, Marseille, France. ATALA \\& ARIA.
Cite (Informal):: HISTOIRESMORALES: Un jeu de données français pour évaluer l’alignement moral des modèles de langage (Leteno et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.jeptalnrecital-trad.16.pdf

PDF Cite Search Fix data