@inproceedings{hanus-etal-2025-uc,
title = "{UC}-{FIR}e: Approche efficace pour la recherche d{'}informations non supervis{\'e}e",
author = "Hanus, Maxime and
Guignard, Quentin and
Rodrigues, Christophe and
De Vinci, L{\'e}onard",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de la 20e Conf{\'e}rence en Recherche d{'}Information et Applications (CORIA)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-coria.22/",
pages = "249--264",
language = "fra",
abstract = "Nous pr{\'e}sentons un mod{\`e}le de recherche d{'}informations non supervis{\'e} conciliant efficacit{\'e} et faible co{\^u}t computationnel, fonctionnant uniquement sur CPU. Plut{\^o}t que de remplacer BM25, nous l{'}am{\'e}liorons en r{\'e}duisant l'{\'e}cart lexical. Notre m{\'e}thode repose sur l{'}entra{\^i}nement de vecteurs de mots FastText et la construction de matrices de coexistence et de similarit{\'e} pour regrouper des mots interchangeables en clusters. Documents et requ{\^e}tes sont r{\'e}{\'e}crits avec ces clusters, am{\'e}liorant la pertinence des r{\'e}sultats sans alourdir l{'}inf{\'e}rence. Exp{\'e}riment{\'e} sur plusieurs corpus de BEIR, notre mod{\`e}le surpasse des approches plus co{\^u}teuses en calcul et obtient de meilleures performances que BM25 sur diverses m{\'e}triques, tout en conservant une vitesse d{'}inf{\'e}rence similaire. Cette recherche d{\'e}montre que notre m{\'e}thode offre une alternative pratique, scalable et {\'e}conomique aux mod{\`e}les denses et hybrides, facilitant son adoption dans des syst{\`e}mes de recherche r{\'e}els. UC-FIRe est disponible publiquement : https://github.com/Limekaaa/UC-FIRe."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="hanus-etal-2025-uc">
<titleInfo>
<title>UC-FIRe: Approche efficace pour la recherche d’informations non supervisée</title>
</titleInfo>
<name type="personal">
<namePart type="given">Maxime</namePart>
<namePart type="family">Hanus</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Quentin</namePart>
<namePart type="family">Guignard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Rodrigues</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Léonard</namePart>
<namePart type="family">De Vinci</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 20e Conférence en Recherche d’Information et Applications (CORIA)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous présentons un modèle de recherche d’informations non supervisé conciliant efficacité et faible coût computationnel, fonctionnant uniquement sur CPU. Plutôt que de remplacer BM25, nous l’améliorons en réduisant l’écart lexical. Notre méthode repose sur l’entraînement de vecteurs de mots FastText et la construction de matrices de coexistence et de similarité pour regrouper des mots interchangeables en clusters. Documents et requêtes sont réécrits avec ces clusters, améliorant la pertinence des résultats sans alourdir l’inférence. Expérimenté sur plusieurs corpus de BEIR, notre modèle surpasse des approches plus coûteuses en calcul et obtient de meilleures performances que BM25 sur diverses métriques, tout en conservant une vitesse d’inférence similaire. Cette recherche démontre que notre méthode offre une alternative pratique, scalable et économique aux modèles denses et hybrides, facilitant son adoption dans des systèmes de recherche réels. UC-FIRe est disponible publiquement : https://github.com/Limekaaa/UC-FIRe.</abstract>
<identifier type="citekey">hanus-etal-2025-uc</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-coria.22/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>249</start>
<end>264</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T UC-FIRe: Approche efficace pour la recherche d’informations non supervisée
%A Hanus, Maxime
%A Guignard, Quentin
%A Rodrigues, Christophe
%A De Vinci, Léonard
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes de la 20e Conférence en Recherche d’Information et Applications (CORIA)
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F hanus-etal-2025-uc
%X Nous présentons un modèle de recherche d’informations non supervisé conciliant efficacité et faible coût computationnel, fonctionnant uniquement sur CPU. Plutôt que de remplacer BM25, nous l’améliorons en réduisant l’écart lexical. Notre méthode repose sur l’entraînement de vecteurs de mots FastText et la construction de matrices de coexistence et de similarité pour regrouper des mots interchangeables en clusters. Documents et requêtes sont réécrits avec ces clusters, améliorant la pertinence des résultats sans alourdir l’inférence. Expérimenté sur plusieurs corpus de BEIR, notre modèle surpasse des approches plus coûteuses en calcul et obtient de meilleures performances que BM25 sur diverses métriques, tout en conservant une vitesse d’inférence similaire. Cette recherche démontre que notre méthode offre une alternative pratique, scalable et économique aux modèles denses et hybrides, facilitant son adoption dans des systèmes de recherche réels. UC-FIRe est disponible publiquement : https://github.com/Limekaaa/UC-FIRe.
%U https://aclanthology.org/2025.jeptalnrecital-coria.22/
%P 249-264
Markdown (Informal)
[UC-FIRe: Approche efficace pour la recherche d’informations non supervisée](https://aclanthology.org/2025.jeptalnrecital-coria.22/) (Hanus et al., JEP/TALN/RECITAL 2025)
ACL