Connaissances factuelles dans les modèles de langue : robustesse et anomalies face à des variations simples du contexte temporel

Hichem Ammar Khodja; Frederic Bechet; Quentin Brabant; Alexis Nasr; Gwénolé Lecorvé

Connaissances factuelles dans les modèles de langue : robustesse et anomalies face à des variations simples du contexte temporel

Hichem Ammar Khodja, Frédéric Béchet, Quentin Brabant, Alexis Nasr, Gwénolé Lecorvé

Abstract

Ce papier explore la robustesse des modèles de langue (ML) face aux variations du contexte temporel dans les connaissances factuelles. Il examine si les ML peuvent associer correctement un contexte temporel à un fait passé valide sur une période de temps délimitée, en leur demandant de différencier les contextes corrects des contextes incorrects. La capacité de distinction des ML est analysée sur deux dimensions : la distance du contexte incorrect par rapport à la période de validité et la granularité du contexte. Pour cela, un jeu de données, TimeStress, est introduit, permettant de tester 18 ML variés. Les résultats révèlent que le meilleur ML n’atteint une distinction parfaite que pour 11% des faits étudiés, avec des erreurs critiques qu’un humain ne ferait pas. Ces travaux soulignent les limites des ML actuels en matière de représentation temporelle.

Anthology ID:: 2025.jeptalnrecital-taln.10
Volume:: Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
Month:: 6
Year:: 2025
Address:: Marseille, France
Editors:: Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:: JEP/TALN/RECITAL
SIG:
Publisher:: ATALA \\& ARIA
Note:
Pages:: 167–195
Language:: French
URL:: https://aclanthology.org/2025.jeptalnrecital-taln.10/
DOI:
Bibkey:
Cite (ACL):: Hichem Ammar Khodja, Frédéric Béchet, Quentin Brabant, Alexis Nasr, and Gwénolé Lecorvé. 2025. Connaissances factuelles dans les modèles de langue : robustesse et anomalies face à des variations simples du contexte temporel. In Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux, pages 167–195, Marseille, France. ATALA \\& ARIA.
Cite (Informal):: Connaissances factuelles dans les modèles de langue : robustesse et anomalies face à des variations simples du contexte temporel (Ammar Khodja et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.jeptalnrecital-taln.10.pdf

PDF Cite Search Fix data