Classification de texte enrichie à l’aide de motifs séquentiels

Pierre Holat, Nadi Tomeh, Thierry Charnois


Abstract
En classification de textes, la plupart des méthodes fondées sur des classifieurs statistiques utilisent des mots, ou des combinaisons de mots contigus, comme descripteurs. Si l’on veut prendre en compte plus d’informations le nombre de descripteurs non contigus augmente exponentiellement. Pour pallier à cette croissance, la fouille de motifs séquentiels permet d’extraire, de façon efficace, un nombre réduit de descripteurs qui sont à la fois fréquents et pertinents grâce à l’utilisation de contraintes. Dans ce papier, nous comparons l’utilisation de motifs fréquents sous contraintes et l’utilisation de motifs -libres, comme descripteurs. Nous montrons les avantages et inconvénients de chaque type de motif.
Anthology ID:
2015.jeptalnrecital-court.38
Volume:
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2015
Address:
Caen, France
Editors:
Jean-Marc Lecarpentier, Nadine Lucas
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
256–262
Language:
URL:
https://aclanthology.org/2015.jeptalnrecital-court.38
DOI:
Bibkey:
Cite (ACL):
Pierre Holat, Nadi Tomeh, and Thierry Charnois. 2015. Classification de texte enrichie à l’aide de motifs séquentiels. In Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 256–262, Caen, France. ATALA.
Cite (Informal):
Classification de texte enrichie à l’aide de motifs séquentiels (Holat et al., JEP/TALN/RECITAL 2015)
Copy Citation:
PDF:
https://aclanthology.org/2015.jeptalnrecital-court.38.pdf