Vers une méthodologie d’annotation des entités nommées en corpus ?

Karën Fort, Maud Ehrmann, Adeline Nazarenko


Abstract
La tâche, aujourd’hui considérée comme fondamentale, de reconnaissance d’entités nommées, présente des difficultés spécifiques en matière d’annotation. Nous les précisons ici, en les illustrant par des expériences d’annotation manuelle dans le domaine de la microbiologie. Ces problèmes nous amènent à reposer la question fondamentale de ce que les annotateurs doivent annoter et surtout, pour quoi faire. Nous identifions pour cela les applications nécessitant l’extraction d’entités nommées et, en fonction des besoins de ces applications, nous proposons de définir sémantiquement les éléments à annoter. Nous présentons ensuite un certain nombre de recommandations méthodologiques permettant d’assurer un cadre d’annotation cohérent et évaluable.
Anthology ID:
2009.jeptalnrecital-long.29
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2009
Address:
Senlis, France
Editors:
Adeline Nazarenko, Thierry Poibeau
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
281–290
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-long.29
DOI:
Bibkey:
Cite (ACL):
Karën Fort, Maud Ehrmann, and Adeline Nazarenko. 2009. Vers une méthodologie d’annotation des entités nommées en corpus ?. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 281–290, Senlis, France. ATALA.
Cite (Informal):
Vers une méthodologie d’annotation des entités nommées en corpus ? (Fort et al., JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://aclanthology.org/2009.jeptalnrecital-long.29.pdf