Mots composés dans les modèles de langue pour la recherche d’information

Carmen Alvarez; Philippe Langlais; Jian-Yun Nie

Mots composés dans les modèles de langue pour la recherche d’information

Carmen Alvarez, Philippe Langlais, Jian-Yun Nie

Correct Metadata for

Use this form to create a GitHub issue with structured data describing the correction. You will need a GitHub account. Once you create that issue, the correction will be reviewed by a staff member.

⚠️ Mobile Users: Submitting this form to create a new issue will only work with github.com, not the GitHub Mobile app.

Important: The Anthology treat PDFs as authoritative. Please use this form only to correct data that is out of line with the PDF. See our corrections guidelines if you need to change the PDF.

Title Adjust the title. Retain tags such as <fixed-case>.

Authors Adjust author names and order to match the PDF.

Abstract Correct abstract if needed. Retain XML formatting tags such as <tex-math>. You may use <b>...</b> for bold, <i>...</i> for italic, and <url>...</url> for URLs.

Verification against PDF Ensure that the new title/authors match the snapshot below. (If there is no snapshot or it is too small, consult the PDF.)

Authors concatenated from the text boxes above:

ALL author names match the snapshot above—including middle initials, hyphens, and accents.

Abstract

Une approche classique en recherche d’information (RI) consiste à bâtir une représentation des documents et des requêtes basée sur les mots simples les constituant. L’utilisation de modèles bigrammes a été étudiée, mais les contraintes sur l’ordre et l’adjacence des mots dans ces travaux ne sont pas toujours justifiées pour la recherche d’information. Nous proposons une nouvelle approche basée sur les modèles de langue qui incorporent des affinités lexicales (ALs), c’est à dire des paires non ordonnées de mots qui se trouvent proches dans un texte. Nous décrivons ce modèle et le comparons aux plus traditionnels modèles unigrammes et bigrammes ainsi qu’au modèle vectoriel.

Anthology ID:: 2004.jeptalnrecital-poster.1
Volume:: Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
Month:: April
Year:: 2004
Address:: Fès, Maroc
Editors:: Philippe Blache, Noël Nguyen, Nouredine Chenfour, Abdenbi Rajouani
Venue:: JEP/TALN/RECITAL
SIG:
Publisher:: ATALA
Note:
Pages:: 1–6
Language:: French
URL:: https://aclanthology.org/2004.jeptalnrecital-poster.1/
DOI:
Bibkey:
Cite (ACL):: Carmen Alvarez, Philippe Langlais, and Jian-Yun Nie. 2004. Mots composés dans les modèles de langue pour la recherche d’information. In Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Posters, pages 1–6, Fès, Maroc. ATALA.
Cite (Informal):: Mots composés dans les modèles de langue pour la recherche d’information (Alvarez et al., JEP/TALN/RECITAL 2004)
Copy Citation:
PDF:: https://aclanthology.org/2004.jeptalnrecital-poster.1.pdf

PDF Cite Search Fix data

Export citation

BibTeX
MODS XML
Endnote
Preformatted

@inproceedings{alvarez-etal-2004-mots,
    title = "Mots compos{\'e}s dans les mod{\`e}les de langue pour la recherche d{'}information",
    author = "Alvarez, Carmen  and
      Langlais, Philippe  and
      Nie, Jian-Yun",
    editor = {Blache, Philippe  and
      Nguyen, No{\"e}l  and
      Chenfour, Nouredine  and
      Rajouani, Abdenbi},
    booktitle = "Actes de la 11{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
    month = apr,
    year = "2004",
    address = "F{\`e}s, Maroc",
    publisher = "ATALA",
    url = "https://aclanthology.org/2004.jeptalnrecital-poster.1/",
    pages = "1--6",
    language = "fra",
    abstract = "Une approche classique en recherche d{'}information (RI) consiste {\`a} b{\^a}tir une repr{\'e}sentation des documents et des requ{\^e}tes bas{\'e}e sur les mots simples les constituant. L{'}utilisation de mod{\`e}les bigrammes a {\'e}t{\'e} {\'e}tudi{\'e}e, mais les contraintes sur l{'}ordre et l{'}adjacence des mots dans ces travaux ne sont pas toujours justifi{\'e}es pour la recherche d{'}information. Nous proposons une nouvelle approche bas{\'e}e sur les mod{\`e}les de langue qui incorporent des affinit{\'e}s lexicales (ALs), c{'}est {\`a} dire des paires non ordonn{\'e}es de mots qui se trouvent proches dans un texte. Nous d{\'e}crivons ce mod{\`e}le et le comparons aux plus traditionnels mod{\`e}les unigrammes et bigrammes ainsi qu{'}au mod{\`e}le vectoriel."
}

Download as File

<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="alvarez-etal-2004-mots">
    <titleInfo>
        <title>Mots composés dans les modèles de langue pour la recherche d’information</title>
    </titleInfo>
    <name type="personal">
        <namePart type="given">Carmen</namePart>
        <namePart type="family">Alvarez</namePart>
        <role>
            <roleTerm authority="marcrelator" type="text">author</roleTerm>
        </role>
    </name>
    <name type="personal">
        <namePart type="given">Philippe</namePart>
        <namePart type="family">Langlais</namePart>
        <role>
            <roleTerm authority="marcrelator" type="text">author</roleTerm>
        </role>
    </name>
    <name type="personal">
        <namePart type="given">Jian-Yun</namePart>
        <namePart type="family">Nie</namePart>
        <role>
            <roleTerm authority="marcrelator" type="text">author</roleTerm>
        </role>
    </name>
    <originInfo>
        <dateIssued>2004-04</dateIssued>
    </originInfo>
    <typeOfResource>text</typeOfResource>
    <language>
        <languageTerm type="text">fra</languageTerm>
    </language>
    <relatedItem type="host">
        <titleInfo>
            <title>Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Posters</title>
        </titleInfo>
        <name type="personal">
            <namePart type="given">Philippe</namePart>
            <namePart type="family">Blache</namePart>
            <role>
                <roleTerm authority="marcrelator" type="text">editor</roleTerm>
            </role>
        </name>
        <name type="personal">
            <namePart type="given">Noël</namePart>
            <namePart type="family">Nguyen</namePart>
            <role>
                <roleTerm authority="marcrelator" type="text">editor</roleTerm>
            </role>
        </name>
        <name type="personal">
            <namePart type="given">Nouredine</namePart>
            <namePart type="family">Chenfour</namePart>
            <role>
                <roleTerm authority="marcrelator" type="text">editor</roleTerm>
            </role>
        </name>
        <name type="personal">
            <namePart type="given">Abdenbi</namePart>
            <namePart type="family">Rajouani</namePart>
            <role>
                <roleTerm authority="marcrelator" type="text">editor</roleTerm>
            </role>
        </name>
        <originInfo>
            <publisher>ATALA</publisher>
            <place>
                <placeTerm type="text">Fès, Maroc</placeTerm>
            </place>
        </originInfo>
        <genre authority="marcgt">conference publication</genre>
    </relatedItem>
    <abstract>Une approche classique en recherche d’information (RI) consiste à bâtir une représentation des documents et des requêtes basée sur les mots simples les constituant. L’utilisation de modèles bigrammes a été étudiée, mais les contraintes sur l’ordre et l’adjacence des mots dans ces travaux ne sont pas toujours justifiées pour la recherche d’information. Nous proposons une nouvelle approche basée sur les modèles de langue qui incorporent des affinités lexicales (ALs), c’est à dire des paires non ordonnées de mots qui se trouvent proches dans un texte. Nous décrivons ce modèle et le comparons aux plus traditionnels modèles unigrammes et bigrammes ainsi qu’au modèle vectoriel.</abstract>
    <identifier type="citekey">alvarez-etal-2004-mots</identifier>
    <location>
        <url>https://aclanthology.org/2004.jeptalnrecital-poster.1/</url>
    </location>
    <part>
        <date>2004-04</date>
        <extent unit="page">
            <start>1</start>
            <end>6</end>
        </extent>
    </part>
</mods>
</modsCollection>

Download as File

%0 Conference Proceedings
%T Mots composés dans les modèles de langue pour la recherche d’information
%A Alvarez, Carmen
%A Langlais, Philippe
%A Nie, Jian-Yun
%Y Blache, Philippe
%Y Nguyen, Noël
%Y Chenfour, Nouredine
%Y Rajouani, Abdenbi
%S Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
%D 2004
%8 April
%I ATALA
%C Fès, Maroc
%G fra
%F alvarez-etal-2004-mots
%X Une approche classique en recherche d’information (RI) consiste à bâtir une représentation des documents et des requêtes basée sur les mots simples les constituant. L’utilisation de modèles bigrammes a été étudiée, mais les contraintes sur l’ordre et l’adjacence des mots dans ces travaux ne sont pas toujours justifiées pour la recherche d’information. Nous proposons une nouvelle approche basée sur les modèles de langue qui incorporent des affinités lexicales (ALs), c’est à dire des paires non ordonnées de mots qui se trouvent proches dans un texte. Nous décrivons ce modèle et le comparons aux plus traditionnels modèles unigrammes et bigrammes ainsi qu’au modèle vectoriel.
%U https://aclanthology.org/2004.jeptalnrecital-poster.1/
%P 1-6

Download as File

Markdown (Informal)

[Mots composés dans les modèles de langue pour la recherche d’information](https://aclanthology.org/2004.jeptalnrecital-poster.1/) (Alvarez et al., JEP/TALN/RECITAL 2004)

Mots composés dans les modèles de langue pour la recherche d’information (Alvarez et al., JEP/TALN/RECITAL 2004)

ACL

Carmen Alvarez, Philippe Langlais, and Jian-Yun Nie. 2004. Mots composés dans les modèles de langue pour la recherche d’information. In Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Posters, pages 1–6, Fès, Maroc. ATALA.