Filtrages syntaxiques de co-occurrences pour la représentation vectorielle de documents

Romaric Besançon, Martin Rajman


Abstract
L’intégration de co-occurrences dans les modèles de représentation vectorielle de documents s’est avérée une source d’amélioration de la pertinence des mesures de similarités textuelles calculées dans le cadre de ces modèles (Rajman et al., 2000; Besançon, 2001). Dans cette optique, la définition des contextes pris en compte pour les co-occurrences est cruciale, par son influence sur les performances des modèles à base de co-occurrences. Dans cet article, nous proposons d’étudier deux méthodes de filtrage des co-occurrences fondées sur l’utilisation d’informations syntaxiques supplémentaires. Nous présentons également une évaluation de ces méthodes dans le cadre de la tâche de la recherche documentaire.
Anthology ID:
2002.jeptalnrecital-long.11
Volume:
Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2002
Address:
Nancy, France
Editor:
Jean-Marie Pierrel
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
136–145
Language:
French
URL:
https://aclanthology.org/2002.jeptalnrecital-long.11
DOI:
Bibkey:
Cite (ACL):
Romaric Besançon and Martin Rajman. 2002. Filtrages syntaxiques de co-occurrences pour la représentation vectorielle de documents. In Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 136–145, Nancy, France. ATALA.
Cite (Informal):
Filtrages syntaxiques de co-occurrences pour la représentation vectorielle de documents (Besançon & Rajman, JEP/TALN/RECITAL 2002)
Copy Citation:
PDF:
https://aclanthology.org/2002.jeptalnrecital-long.11.pdf