Explicabilité par Perturbations pour les Systèmes RAG

Yongxin Zhou, Philippe Mulhem, Didier Schwab


Abstract
Les systèmes de Génération Augmentée par Récupération (RAG) ont pour objectif d’améliorer les Grands Modèles de Langage (LLM) en intégrant des informations provenant de sources externes pour générer des réponses, mais leur manque de transparence en terme d’explicabilité soulève des préoccupations, particulièrement dans des domaines tels que la santé, la finance ou le droit. Les méthodes par perturbations fournissent une explicabilité post-hoc, avec des RAG considérés comme des boîtes noires, en modifiant systématiquement les entrées ou documents récupérés pour évaluer la stabilité des réponses et l’attribution des sources. Ce document présente un aperçu de l’explicabilité des systèmes RAG, en se concentrant sur les approches basées sur des exemples et des perturbations. Nous proposons une taxonomie des techniques de perturbation à différents niveaux de granularité, montrant comment elles offrent des indicateurs interprétables sur le comportement des modèles
Anthology ID:
2025.jeptalnrecital-diagllm.1
Volume:
Actes de l'atelier Accès à l’information basé sur le dialogue et grands modèles de langage 2025 (DIAG-LLM)
Month:
6
Year:
2025
Address:
Marseille, France
Editors:
Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA \\& ARIA
Note:
Pages:
1–6
Language:
French
URL:
https://aclanthology.org/2025.jeptalnrecital-diagllm.1/
DOI:
Bibkey:
Cite (ACL):
Yongxin Zhou, Philippe Mulhem, and Didier Schwab. 2025. Explicabilité par Perturbations pour les Systèmes RAG. In Actes de l'atelier Accès à l’information basé sur le dialogue et grands modèles de langage 2025 (DIAG-LLM), pages 1–6, Marseille, France. ATALA \\& ARIA.
Cite (Informal):
Explicabilité par Perturbations pour les Systèmes RAG (Zhou et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:
https://aclanthology.org/2025.jeptalnrecital-diagllm.1.pdf