Évaluer la capacité des transformeurs à distinguer les significations compositionnelles et idiomatiques d’une même expression

Nina Nusbaumer; Guillaume Wisniewski; Benoit Crabbé

Évaluer la capacité des transformeurs à distinguer les significations compositionnelles et idiomatiques d’une même expression

Nina Nusbaumer, Guillaume Wisniewski, Benoît Crabbé

Abstract

Cet article explore comment les modèles de langue fondés sur les transformeurs encodent les significations compositionnelles et non-compositionnelles de séquences en anglais comme big fish, qui, selon le contexte, peuvent signifier soit « grand poisson », soit « personne importante ». Nous avons mené des expériences pour évaluer : (1) la distinction entre les plongements lexicaux des groupes nominaux compositionnels et non compositionnels à travers les couches du modèle de langue, (2) leur séparabilité linéaire, et (3) l’unité lexicale des séquences non compositionnelle. Nos résultats montrent que le modèle différencie bien les deux significations, et ce dès les premières couches, avec néanmoins une variabilité selon les expressions. De plus, s’appuyant sur des informations contextuelles plus larges, le modèle ne traite pas les expressions idiomatiques comme lexicalement plus unifiées que leurs équivalents compositionnels.

Anthology ID:: 2025.jeptalnrecital-taln.22
Volume:: Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
Month:: 6
Year:: 2025
Address:: Marseille, France
Editors:: Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:: JEP/TALN/RECITAL
SIG:
Publisher:: ATALA \\& ARIA
Note:
Pages:: 360–375
Language:: French
URL:: https://aclanthology.org/2025.jeptalnrecital-taln.22/
DOI:
Bibkey:
Cite (ACL):: Nina Nusbaumer, Guillaume Wisniewski, and Benoît Crabbé. 2025. Évaluer la capacité des transformeurs à distinguer les significations compositionnelles et idiomatiques d’une même expression. In Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux, pages 360–375, Marseille, France. ATALA \\& ARIA.
Cite (Informal):: Évaluer la capacité des transformeurs à distinguer les significations compositionnelles et idiomatiques d’une même expression (Nusbaumer et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.jeptalnrecital-taln.22.pdf

PDF Cite Search Fix data