Yann Vigile Hoareau

Also published as: Yann Vigile Hoareau

2012

Algorithme automatique non supervisé pour le Deft 2012 (Automatic unsupervised algorithm for Deft 2012) [in French]
Murat Ahat | Coralie Petermann | Yann Vigile Hoareau | Soufian Ben Amor | Marc Bui
JEP-TALN-RECITAL 2012, Workshop DEFT 2012: DÉfi Fouille de Textes (DEFT 2012 Workshop: Text Mining Challenge)

2010

pdf bib abs

Une approche cognitive de la fouille de grandes collections de documents
Adil El Ghali | Yann Vigile Hoareau
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs

La récente éclosion du Web2.0 engendre un accroissement considérable de volumes textuels et intensifie ainsi l’importance d’une réflexion sur l’exploitation des connaissances à partir de grandes collections de documents. Dans cet article, nous présentons une approche de rechercher d’information qui s’inspire des certaines recherches issues de la psychologie cognitive pour la fouille de larges collections de documents. Nous utilisons un document comme requête permettant de récupérer des informations à partir d’une collection représentée dans un espace sémantique. Nous définissons les notions d’identité sémantique et de pollution sémantique dans un espace de documents. Nous illustrons notre approche par la description d’un système appelé BRAT (Blogosphere Random Analysis using Texts) basé sur les notions préalablement introduites d’identité et de pollution sématique appliquées à une tâche d’identification des actualités dans la blogosphère mondiale lors du concours TREC’09. Les premiers résultats produits sont tout à fait encourageant et indiquent les pistes des recherches à mettre en oeuvre afin d’améliorer les performances de BRAT.