@inproceedings{adjali-etal-2025-generation,
title = "G{\'e}n{\'e}ration augment{\'e}e de r{\'e}cup{\'e}ration multi-niveau pour r{\'e}pondre {\`a} des questions visuelles",
author = "Adjali, Omar and
Ferret, Olivier and
Ghannay, Sahar and
Le Borgne, Herv{\'e}",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de la 20e Conf{\'e}rence en Recherche d{'}Information et Applications (CORIA)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-coria.11/",
pages = "128--130",
language = "fra",
abstract = {La t{\^a}che de r{\'e}ponse {\`a} des questions visuelles {\`a} propos d{'}entit{\'e}s nomm{\'e}es, qui s{'}appuie sur la d{\'e}sambigu{\"i}sation des entit{\'e}s {\`a} l{'}aide d{'}informations textuelles et visuelles ainsi que de connaissances, se d{\'e}compose principalement en deux {\'e}tapes : recherche d{'}information puis recherche des r{\'e}ponses, souvent abord{\'e}es ind{\'e}pendamment l{'}une de l{'}autre. La g{\'e}n{\'e}ration augment{\'e}e de r{\'e}cup{\'e}ration (RAG) offre une solution {\`a} ce manque d{'}interaction en utilisant les r{\'e}ponses g{\'e}n{\'e}r{\'e}es comme signal pour l{'}entra{\^i}nement de la recherche d{'}information. Le RAG s{'}appuie g{\'e}n{\'e}ralement sur des passages pseudo-pertinents extraits de bases de connaissances externes, ce qui peut conduire {\`a} des erreurs au niveau de la g{\'e}n{\'e}ration de r{\'e}ponses. Dans ce travail, nous proposons une approche de RAG {\`a} plusieurs niveaux am{\'e}liorant la g{\'e}n{\'e}ration de r{\'e}ponses en associant recherche d{'}entit{\'e}s et expansion de requ{\^e}te. Plus pr{\'e}cis{\'e}ment, nous d{\'e}finissons une fonction de perte RAG permettant de conditionner la g{\'e}n{\'e}ration de r{\'e}ponses {\`a} la fois par la recherche d{'}entit{\'e}s et celle de passages. Cette approche permet de d{\'e}passer les travaux existants sur le jeu d'{\'e}valuation ViQuAE, d{\'e}montrant ainsi que les connaissances qu{'}elle va chercher sont plus pertinentes pour la g{\'e}n{\'e}ration de r{\'e}ponses.}
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="adjali-etal-2025-generation">
<titleInfo>
<title>Génération augmentée de récupération multi-niveau pour répondre à des questions visuelles</title>
</titleInfo>
<name type="personal">
<namePart type="given">Omar</namePart>
<namePart type="family">Adjali</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Olivier</namePart>
<namePart type="family">Ferret</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Sahar</namePart>
<namePart type="family">Ghannay</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Hervé</namePart>
<namePart type="family">Le Borgne</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 20e Conférence en Recherche d’Information et Applications (CORIA)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La tâche de réponse à des questions visuelles à propos d’entités nommées, qui s’appuie sur la désambiguïsation des entités à l’aide d’informations textuelles et visuelles ainsi que de connaissances, se décompose principalement en deux étapes : recherche d’information puis recherche des réponses, souvent abordées indépendamment l’une de l’autre. La génération augmentée de récupération (RAG) offre une solution à ce manque d’interaction en utilisant les réponses générées comme signal pour l’entraînement de la recherche d’information. Le RAG s’appuie généralement sur des passages pseudo-pertinents extraits de bases de connaissances externes, ce qui peut conduire à des erreurs au niveau de la génération de réponses. Dans ce travail, nous proposons une approche de RAG à plusieurs niveaux améliorant la génération de réponses en associant recherche d’entités et expansion de requête. Plus précisément, nous définissons une fonction de perte RAG permettant de conditionner la génération de réponses à la fois par la recherche d’entités et celle de passages. Cette approche permet de dépasser les travaux existants sur le jeu d’évaluation ViQuAE, démontrant ainsi que les connaissances qu’elle va chercher sont plus pertinentes pour la génération de réponses.</abstract>
<identifier type="citekey">adjali-etal-2025-generation</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-coria.11/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>128</start>
<end>130</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Génération augmentée de récupération multi-niveau pour répondre à des questions visuelles
%A Adjali, Omar
%A Ferret, Olivier
%A Ghannay, Sahar
%A Le Borgne, Hervé
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes de la 20e Conférence en Recherche d’Information et Applications (CORIA)
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F adjali-etal-2025-generation
%X La tâche de réponse à des questions visuelles à propos d’entités nommées, qui s’appuie sur la désambiguïsation des entités à l’aide d’informations textuelles et visuelles ainsi que de connaissances, se décompose principalement en deux étapes : recherche d’information puis recherche des réponses, souvent abordées indépendamment l’une de l’autre. La génération augmentée de récupération (RAG) offre une solution à ce manque d’interaction en utilisant les réponses générées comme signal pour l’entraînement de la recherche d’information. Le RAG s’appuie généralement sur des passages pseudo-pertinents extraits de bases de connaissances externes, ce qui peut conduire à des erreurs au niveau de la génération de réponses. Dans ce travail, nous proposons une approche de RAG à plusieurs niveaux améliorant la génération de réponses en associant recherche d’entités et expansion de requête. Plus précisément, nous définissons une fonction de perte RAG permettant de conditionner la génération de réponses à la fois par la recherche d’entités et celle de passages. Cette approche permet de dépasser les travaux existants sur le jeu d’évaluation ViQuAE, démontrant ainsi que les connaissances qu’elle va chercher sont plus pertinentes pour la génération de réponses.
%U https://aclanthology.org/2025.jeptalnrecital-coria.11/
%P 128-130
Markdown (Informal)
[Génération augmentée de récupération multi-niveau pour répondre à des questions visuelles](https://aclanthology.org/2025.jeptalnrecital-coria.11/) (Adjali et al., JEP/TALN/RECITAL 2025)
ACL