@inproceedings{nouali-etal-2025-exploration,
title = "Exploration du {RAG} pour la g{\'e}n{\'e}ration de r{\'e}ponses {\`a} des questions en contexte {\'e}ducatif: {\'e}tude sur les donn{\'e}es {SCIQ}",
author = "Nouali, Sarah and
Badache, Ismail and
Bellot, Patrice",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de l'atelier Intelligence Artificielle g{\'e}n{\'e}rative et {\'E}DUcation : Enjeux, D{\'e}fis et Perspectives de Recherche 2025 (IA-{\'E}DU)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-iaedu.5/",
pages = "29--41",
language = "fra",
abstract = "Les syst{\`e}mes bas{\'e}s sur le RAG (Retrieval-Augmented Generation) sont des syst{\`e}mes qui optimisent la puissance des grands mod{\`e}les de langue (LLM, en anglais, Large Language Models) avec une recherche d{'}information (RI) {\`a} partir de sources de connaissances externes, sans avoir besoin de r{\'e}entra{\^i}ner le mod{\`e}le. Ce type d{'}approche est connu pour am{\'e}liorer les r{\'e}ponses du LLM, en particulier pour r{\'e}pondre {\`a} des questions sp{\'e}cifiques {\`a} un domaine, et r{\'e}duire le ph{\'e}nom{\`e}ne d{'}hallucination constat{\'e} avec ces derniers. Dans cet article, nous explorons l{'}application d{'}un tel syst{\`e}me dans un contexte p{\'e}dagogique, en utilisant le jeu de donn{\'e}es SCIQ (SCIence Questions), un ensemble de questions scientifiques {\`a} choix multiples de niveau scolaire, qui nous permet d'{\'e}valuer la capacit{\'e} des mod{\`e}les {\`a} fournir des r{\'e}ponses pr{\'e}cises, p{\'e}dagogiques et v{\'e}rifiables. Nous {\'e}valuons les performances du syst{\`e}me par rapport {\`a} un mod{\`e}le g{\'e}n{\'e}ratif standard (Llama3 8b et Mistral 7b) de r{\'e}ponse aux questions et analysons ses forces et ses limites dans un contexte {\'e}ducatif. La performance la plus {\'e}lev{\'e}e en termes de pr{\'e}cision a {\'e}t{\'e} enregistr{\'e}e avec l{'}approche bas{\'e}e sur le RAG (rag-llama), qui a permis d{'}atteindre une pr{\'e}cision globalement sup{\'e}rieure par rapport aux autres approches test{\'e}es."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="nouali-etal-2025-exploration">
<titleInfo>
<title>Exploration du RAG pour la génération de réponses à des questions en contexte éducatif: étude sur les données SCIQ</title>
</titleInfo>
<name type="personal">
<namePart type="given">Sarah</namePart>
<namePart type="family">Nouali</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Ismail</namePart>
<namePart type="family">Badache</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Patrice</namePart>
<namePart type="family">Bellot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de l’atelier Intelligence Artificielle générative et ÉDUcation : Enjeux, Défis et Perspectives de Recherche 2025 (IA-ÉDU)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les systèmes basés sur le RAG (Retrieval-Augmented Generation) sont des systèmes qui optimisent la puissance des grands modèles de langue (LLM, en anglais, Large Language Models) avec une recherche d’information (RI) à partir de sources de connaissances externes, sans avoir besoin de réentraîner le modèle. Ce type d’approche est connu pour améliorer les réponses du LLM, en particulier pour répondre à des questions spécifiques à un domaine, et réduire le phénomène d’hallucination constaté avec ces derniers. Dans cet article, nous explorons l’application d’un tel système dans un contexte pédagogique, en utilisant le jeu de données SCIQ (SCIence Questions), un ensemble de questions scientifiques à choix multiples de niveau scolaire, qui nous permet d’évaluer la capacité des modèles à fournir des réponses précises, pédagogiques et vérifiables. Nous évaluons les performances du système par rapport à un modèle génératif standard (Llama3 8b et Mistral 7b) de réponse aux questions et analysons ses forces et ses limites dans un contexte éducatif. La performance la plus élevée en termes de précision a été enregistrée avec l’approche basée sur le RAG (rag-llama), qui a permis d’atteindre une précision globalement supérieure par rapport aux autres approches testées.</abstract>
<identifier type="citekey">nouali-etal-2025-exploration</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-iaedu.5/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>29</start>
<end>41</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Exploration du RAG pour la génération de réponses à des questions en contexte éducatif: étude sur les données SCIQ
%A Nouali, Sarah
%A Badache, Ismail
%A Bellot, Patrice
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes de l’atelier Intelligence Artificielle générative et ÉDUcation : Enjeux, Défis et Perspectives de Recherche 2025 (IA-ÉDU)
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F nouali-etal-2025-exploration
%X Les systèmes basés sur le RAG (Retrieval-Augmented Generation) sont des systèmes qui optimisent la puissance des grands modèles de langue (LLM, en anglais, Large Language Models) avec une recherche d’information (RI) à partir de sources de connaissances externes, sans avoir besoin de réentraîner le modèle. Ce type d’approche est connu pour améliorer les réponses du LLM, en particulier pour répondre à des questions spécifiques à un domaine, et réduire le phénomène d’hallucination constaté avec ces derniers. Dans cet article, nous explorons l’application d’un tel système dans un contexte pédagogique, en utilisant le jeu de données SCIQ (SCIence Questions), un ensemble de questions scientifiques à choix multiples de niveau scolaire, qui nous permet d’évaluer la capacité des modèles à fournir des réponses précises, pédagogiques et vérifiables. Nous évaluons les performances du système par rapport à un modèle génératif standard (Llama3 8b et Mistral 7b) de réponse aux questions et analysons ses forces et ses limites dans un contexte éducatif. La performance la plus élevée en termes de précision a été enregistrée avec l’approche basée sur le RAG (rag-llama), qui a permis d’atteindre une précision globalement supérieure par rapport aux autres approches testées.
%U https://aclanthology.org/2025.jeptalnrecital-iaedu.5/
%P 29-41
Markdown (Informal)
[Exploration du RAG pour la génération de réponses à des questions en contexte éducatif: étude sur les données SCIQ](https://aclanthology.org/2025.jeptalnrecital-iaedu.5/) (Nouali et al., JEP/TALN/RECITAL 2025)
ACL