Extraction semi-automatique d’un vocabulaire savant de base pour l’indexation automatique

Lyne Da Sylva


Abstract
Le projet décrit vise à soutenir les efforts de constitution de ressources lexicales utiles à l’indexation automatique. Un type de vocabulaire utile à l’indexation est défini, le vocabulaire savant de base, qui peut s’articuler avec le vocabulaire spécialisé pour constituer des entrées d’index structurées. On présente les résultats d’ une expérimentation d’ extraction (semi-)automatique des mots du vocabulaire savant de base à partir d’un corpus ciblé, constitué de résumés d’articles scientifiques en français et en anglais. La tâche d’extraction a réussi à doubler une liste originale constituée manuellement pour le français. La comparaison est établie avec une expérimentation similaire effectuée pour l’anglais sur un corpus plus grand et contenant des résumés d’articles non seulement en sciences pures mais aussi en sciences humaines et sociales.
Anthology ID:
2010.jeptalnrecital-long.37
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Editors:
Philippe Langlais, Michel Gagnon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
363–372
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.37
DOI:
Bibkey:
Cite (ACL):
Lyne Da Sylva. 2010. Extraction semi-automatique d’un vocabulaire savant de base pour l’indexation automatique. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 363–372, Montréal, Canada. ATALA.
Cite (Informal):
Extraction semi-automatique d’un vocabulaire savant de base pour l’indexation automatique (Da Sylva, JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-long.37.pdf