Approche statistique pour le repérage de mots informatifs dans les textes oraux

Narjès Boufaden, Yoshua Bengio, Guy Lapalme


Abstract
Nous présentons les résultats de l’approche statistique que nous avons développée pour le repérage de mots informatifs à partir de textes oraux. Ce travail fait partie d’un projet lancé par le département de la défense canadienne pour le développement d’un système d’extraction d’information dans le domaine de la Recherche et Sauvetage maritime (SAR). Il s’agit de trouver et annoter les mots pertinents avec des étiquettes sémantiques qui sont les concepts d’une ontologie du domaine (SAR). Notre méthode combine deux types d’information : les vecteurs de similarité générés grâce à l’ontologie du domaine et le dictionnaire-thésaurus Wordsmyth ; le contexte d’énonciation représenté par le thème. L’évaluation est effectuée en comparant la sortie du système avec les réponses de formulaires d’extraction d’information prédéfinis. Les résultats obtenus sur les textes oraux sont comparables à ceux obtenus dans le cadre de MUC7 pour des textes écrits.
Anthology ID:
2004.jeptalnrecital-long.26
Volume:
Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
April
Year:
2004
Address:
Fès, Maroc
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
249–258
Language:
French
URL:
https://aclanthology.org/2004.jeptalnrecital-long.26
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2004.jeptalnrecital-long.26.pdf