@inproceedings{el-ghali-vigile-hoareau-2010-une,
title = "Une approche cognitive de la fouille de grandes collections de documents",
author = "El Ghali, Adil and
Vigile Hoareau, Yann",
booktitle = "Actes de la 17e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jul,
year = "2010",
address = "Montr{\'e}al, Canada",
publisher = "ATALA",
url = "https://aclanthology.org/2010.jeptalnrecital-long.6",
pages = "51--60",
abstract = "La r{\'e}cente {\'e}closion du Web2.0 engendre un accroissement consid{\'e}rable de volumes textuels et intensifie ainsi l{'}importance d{'}une r{\'e}flexion sur l{'}exploitation des connaissances {\`a} partir de grandes collections de documents. Dans cet article, nous pr{\'e}sentons une approche de rechercher d{'}information qui s{'}inspire des certaines recherches issues de la psychologie cognitive pour la fouille de larges collections de documents. Nous utilisons un document comme requ{\^e}te permettant de r{\'e}cup{\'e}rer des informations {\`a} partir d{'}une collection repr{\'e}sent{\'e}e dans un espace s{\'e}mantique. Nous d{\'e}finissons les notions d{'}identit{\'e} s{\'e}mantique et de pollution s{\'e}mantique dans un espace de documents. Nous illustrons notre approche par la description d{'}un syst{\`e}me appel{\'e} BRAT (Blogosphere Random Analysis using Texts) bas{\'e} sur les notions pr{\'e}alablement introduites d{'}identit{\'e} et de pollution s{\'e}matique appliqu{\'e}es {\`a} une t{\^a}che d{'}identification des actualit{\'e}s dans la blogosph{\`e}re mondiale lors du concours TREC{'}09. Les premiers r{\'e}sultats produits sont tout {\`a} fait encourageant et indiquent les pistes des recherches {\`a} mettre en oeuvre afin d{'}am{\'e}liorer les performances de BRAT.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="el-ghali-vigile-hoareau-2010-une">
<titleInfo>
<title>Une approche cognitive de la fouille de grandes collections de documents</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adil</namePart>
<namePart type="family">El Ghali</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Yann</namePart>
<namePart type="family">Vigile Hoareau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2010-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Montréal, Canada</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La récente éclosion du Web2.0 engendre un accroissement considérable de volumes textuels et intensifie ainsi l’importance d’une réflexion sur l’exploitation des connaissances à partir de grandes collections de documents. Dans cet article, nous présentons une approche de rechercher d’information qui s’inspire des certaines recherches issues de la psychologie cognitive pour la fouille de larges collections de documents. Nous utilisons un document comme requête permettant de récupérer des informations à partir d’une collection représentée dans un espace sémantique. Nous définissons les notions d’identité sémantique et de pollution sémantique dans un espace de documents. Nous illustrons notre approche par la description d’un système appelé BRAT (Blogosphere Random Analysis using Texts) basé sur les notions préalablement introduites d’identité et de pollution sématique appliquées à une tâche d’identification des actualités dans la blogosphère mondiale lors du concours TREC’09. Les premiers résultats produits sont tout à fait encourageant et indiquent les pistes des recherches à mettre en oeuvre afin d’améliorer les performances de BRAT.</abstract>
<identifier type="citekey">el-ghali-vigile-hoareau-2010-une</identifier>
<location>
<url>https://aclanthology.org/2010.jeptalnrecital-long.6</url>
</location>
<part>
<date>2010-07</date>
<extent unit="page">
<start>51</start>
<end>60</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Une approche cognitive de la fouille de grandes collections de documents
%A El Ghali, Adil
%A Vigile Hoareau, Yann
%S Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2010
%8 July
%I ATALA
%C Montréal, Canada
%G French
%F el-ghali-vigile-hoareau-2010-une
%X La récente éclosion du Web2.0 engendre un accroissement considérable de volumes textuels et intensifie ainsi l’importance d’une réflexion sur l’exploitation des connaissances à partir de grandes collections de documents. Dans cet article, nous présentons une approche de rechercher d’information qui s’inspire des certaines recherches issues de la psychologie cognitive pour la fouille de larges collections de documents. Nous utilisons un document comme requête permettant de récupérer des informations à partir d’une collection représentée dans un espace sémantique. Nous définissons les notions d’identité sémantique et de pollution sémantique dans un espace de documents. Nous illustrons notre approche par la description d’un système appelé BRAT (Blogosphere Random Analysis using Texts) basé sur les notions préalablement introduites d’identité et de pollution sématique appliquées à une tâche d’identification des actualités dans la blogosphère mondiale lors du concours TREC’09. Les premiers résultats produits sont tout à fait encourageant et indiquent les pistes des recherches à mettre en oeuvre afin d’améliorer les performances de BRAT.
%U https://aclanthology.org/2010.jeptalnrecital-long.6
%P 51-60
Markdown (Informal)
[Une approche cognitive de la fouille de grandes collections de documents](https://aclanthology.org/2010.jeptalnrecital-long.6) (El Ghali & Vigile Hoareau, JEP/TALN/RECITAL 2010)
ACL