@inproceedings{chappelier-eckard-2009-utilisation,
title = "Utilisation de {PLSI} en recherche d`information Repr{\'e}sentation des requ{\^e}tes",
author = "Chappelier, Jean-C{\'e}dric and
Eckard, Emmanuel",
editor = "Nazarenko, Adeline and
Poibeau, Thierry",
booktitle = "Actes de la 16{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles courts",
month = jun,
year = "2009",
address = "Senlis, France",
publisher = "ATALA",
url = "https://aclanthology.org/2009.jeptalnrecital-court.45/",
pages = "414--422",
language = "fra",
abstract = "Le mod{\`e}le PLSI ({\guillemotleft} Probabilistic Latent Semantic Indexing {\guillemotright}) offre une approche de l`indexation de documents fond{\'e}e sur des mod{\`e}les probabilistes de cat{\'e}gories s{\'e}mantiques latentes et a conduit {\`a} des applications dans diff{\'e}rents domaines. Toutefois, ce mod{\`e}le rend impossible le traitement de documents inconnus au moment de l`apprentissage, probl{\`e}me particuli{\`e}rement sensible pour la repr{\'e}sentation des requ{\^e}tes dans le cadre de la recherche d`information. Une m{\'e}thode, dite de {\guillemotleft} folding-in {\guillemotright}, permet dans une certaine mesure de contourner ce probl{\`e}me, mais pr{\'e}sente des faiblesses. Cet article introduit nouvelle une mesure de similarit{\'e} document-requ{\^e}te pour PLSI, fond{\'e}e sur lesmod{\`e}les de langue, o{\`u} le probl{\`e}me du {\guillemotleft} folding-in {\guillemotright} ne se pose pas. Nous comparons cette nouvelle similarit{\'e} aux noyaux de Fisher, l'{\'e}tat de l`art en la mati{\`e}re. Nous pr{\'e}sentons aussi une {\'e}valuation de PLSI sur un corpus de recherche d`information de pr{\`e}s de 7500 documents et de plus d`un million d`occurrences de termes provenant de la collection TREC{--}AP, une taille consid{\'e}rable dans le cadre de PLSI."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="chappelier-eckard-2009-utilisation">
<titleInfo>
<title>Utilisation de PLSI en recherche d‘information Représentation des requêtes</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jean-Cédric</namePart>
<namePart type="family">Chappelier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Eckard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2009-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Nazarenko</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Poibeau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Senlis, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Le modèle PLSI (\guillemotleft Probabilistic Latent Semantic Indexing \guillemotright) offre une approche de l‘indexation de documents fondée sur des modèles probabilistes de catégories sémantiques latentes et a conduit à des applications dans différents domaines. Toutefois, ce modèle rend impossible le traitement de documents inconnus au moment de l‘apprentissage, problème particulièrement sensible pour la représentation des requêtes dans le cadre de la recherche d‘information. Une méthode, dite de \guillemotleft folding-in \guillemotright, permet dans une certaine mesure de contourner ce problème, mais présente des faiblesses. Cet article introduit nouvelle une mesure de similarité document-requête pour PLSI, fondée sur lesmodèles de langue, où le problème du \guillemotleft folding-in \guillemotright ne se pose pas. Nous comparons cette nouvelle similarité aux noyaux de Fisher, l’état de l‘art en la matière. Nous présentons aussi une évaluation de PLSI sur un corpus de recherche d‘information de près de 7500 documents et de plus d‘un million d‘occurrences de termes provenant de la collection TREC–AP, une taille considérable dans le cadre de PLSI.</abstract>
<identifier type="citekey">chappelier-eckard-2009-utilisation</identifier>
<location>
<url>https://aclanthology.org/2009.jeptalnrecital-court.45/</url>
</location>
<part>
<date>2009-06</date>
<extent unit="page">
<start>414</start>
<end>422</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Utilisation de PLSI en recherche d‘information Représentation des requêtes
%A Chappelier, Jean-Cédric
%A Eckard, Emmanuel
%Y Nazarenko, Adeline
%Y Poibeau, Thierry
%S Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
%D 2009
%8 June
%I ATALA
%C Senlis, France
%G fra
%F chappelier-eckard-2009-utilisation
%X Le modèle PLSI (\guillemotleft Probabilistic Latent Semantic Indexing \guillemotright) offre une approche de l‘indexation de documents fondée sur des modèles probabilistes de catégories sémantiques latentes et a conduit à des applications dans différents domaines. Toutefois, ce modèle rend impossible le traitement de documents inconnus au moment de l‘apprentissage, problème particulièrement sensible pour la représentation des requêtes dans le cadre de la recherche d‘information. Une méthode, dite de \guillemotleft folding-in \guillemotright, permet dans une certaine mesure de contourner ce problème, mais présente des faiblesses. Cet article introduit nouvelle une mesure de similarité document-requête pour PLSI, fondée sur lesmodèles de langue, où le problème du \guillemotleft folding-in \guillemotright ne se pose pas. Nous comparons cette nouvelle similarité aux noyaux de Fisher, l’état de l‘art en la matière. Nous présentons aussi une évaluation de PLSI sur un corpus de recherche d‘information de près de 7500 documents et de plus d‘un million d‘occurrences de termes provenant de la collection TREC–AP, une taille considérable dans le cadre de PLSI.
%U https://aclanthology.org/2009.jeptalnrecital-court.45/
%P 414-422
Markdown (Informal)
[Utilisation de PLSI en recherche d’information Représentation des requêtes](https://aclanthology.org/2009.jeptalnrecital-court.45/) (Chappelier & Eckard, JEP/TALN/RECITAL 2009)
ACL