@inproceedings{alvarez-etal-2004-mots,
title = "Mots compos{\'e}s dans les mod{\`e}les de langue pour la recherche d{'}information",
author = "Alvarez, Carmen and
Langlais, Philippe and
Nie, Jian-Yun",
editor = {Blache, Philippe and
Nguyen, No{\"e}l and
Chenfour, Nouredine and
Rajouani, Abdenbi},
booktitle = "Actes de la 11{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = apr,
year = "2004",
address = "F{\`e}s, Maroc",
publisher = "ATALA",
url = "https://aclanthology.org/2004.jeptalnrecital-poster.1",
pages = "1--6",
abstract = "Une approche classique en recherche d{'}information (RI) consiste {\`a} b{\^a}tir une repr{\'e}sentation des documents et des requ{\^e}tes bas{\'e}e sur les mots simples les constituant. L{'}utilisation de mod{\`e}les bigrammes a {\'e}t{\'e} {\'e}tudi{\'e}e, mais les contraintes sur l{'}ordre et l{'}adjacence des mots dans ces travaux ne sont pas toujours justifi{\'e}es pour la recherche d{'}information. Nous proposons une nouvelle approche bas{\'e}e sur les mod{\`e}les de langue qui incorporent des affinit{\'e}s lexicales (ALs), c{'}est {\`a} dire des paires non ordonn{\'e}es de mots qui se trouvent proches dans un texte. Nous d{\'e}crivons ce mod{\`e}le et le comparons aux plus traditionnels mod{\`e}les unigrammes et bigrammes ainsi qu{'}au mod{\`e}le vectoriel.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="alvarez-etal-2004-mots">
<titleInfo>
<title>Mots composés dans les modèles de langue pour la recherche d’information</title>
</titleInfo>
<name type="personal">
<namePart type="given">Carmen</namePart>
<namePart type="family">Alvarez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Langlais</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jian-Yun</namePart>
<namePart type="family">Nie</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2004-04</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Posters</title>
</titleInfo>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Blache</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Noël</namePart>
<namePart type="family">Nguyen</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nouredine</namePart>
<namePart type="family">Chenfour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Abdenbi</namePart>
<namePart type="family">Rajouani</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Fès, Maroc</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Une approche classique en recherche d’information (RI) consiste à bâtir une représentation des documents et des requêtes basée sur les mots simples les constituant. L’utilisation de modèles bigrammes a été étudiée, mais les contraintes sur l’ordre et l’adjacence des mots dans ces travaux ne sont pas toujours justifiées pour la recherche d’information. Nous proposons une nouvelle approche basée sur les modèles de langue qui incorporent des affinités lexicales (ALs), c’est à dire des paires non ordonnées de mots qui se trouvent proches dans un texte. Nous décrivons ce modèle et le comparons aux plus traditionnels modèles unigrammes et bigrammes ainsi qu’au modèle vectoriel.</abstract>
<identifier type="citekey">alvarez-etal-2004-mots</identifier>
<location>
<url>https://aclanthology.org/2004.jeptalnrecital-poster.1</url>
</location>
<part>
<date>2004-04</date>
<extent unit="page">
<start>1</start>
<end>6</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Mots composés dans les modèles de langue pour la recherche d’information
%A Alvarez, Carmen
%A Langlais, Philippe
%A Nie, Jian-Yun
%Y Blache, Philippe
%Y Nguyen, Noël
%Y Chenfour, Nouredine
%Y Rajouani, Abdenbi
%S Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
%D 2004
%8 April
%I ATALA
%C Fès, Maroc
%G French
%F alvarez-etal-2004-mots
%X Une approche classique en recherche d’information (RI) consiste à bâtir une représentation des documents et des requêtes basée sur les mots simples les constituant. L’utilisation de modèles bigrammes a été étudiée, mais les contraintes sur l’ordre et l’adjacence des mots dans ces travaux ne sont pas toujours justifiées pour la recherche d’information. Nous proposons une nouvelle approche basée sur les modèles de langue qui incorporent des affinités lexicales (ALs), c’est à dire des paires non ordonnées de mots qui se trouvent proches dans un texte. Nous décrivons ce modèle et le comparons aux plus traditionnels modèles unigrammes et bigrammes ainsi qu’au modèle vectoriel.
%U https://aclanthology.org/2004.jeptalnrecital-poster.1
%P 1-6
Markdown (Informal)
[Mots composés dans les modèles de langue pour la recherche d’information](https://aclanthology.org/2004.jeptalnrecital-poster.1) (Alvarez et al., JEP/TALN/RECITAL 2004)
ACL