Informations spatio-temporelles et objets touristiques dans des pages Web : repérage et annotation

Stéphanie Weiser


Abstract
Cet article présente un projet de repérage, d’extraction et d’annotation d’informations temporelles, d’informations spatiales et d’objets touristiques dans des pages Web afin d’alimenter la base de connaissance d’un portail touristique. Nous portons une attention particulière aux différences qui distinguent le repérage d’information dans des pages Web du repérage d’informations dans des documents structurés. Après avoir introduit et classifié les différentes informations à extraire, nous nous intéressons à la façon de lier ces informations entre elles (par exemple apparier une information d’ouverture et un restaurant) et de les annoter. Nous présentons également le logiciel que nous avons réalisé afin d’effectuer cette opération d’annotation ainsi que les premiers résultats obtenus. Enfin, nous nous intéressons aux autres types de marques que l’on trouve dans les pages Web, les marques sémiotiques en particulier, dont l’analyse peut être utile à l’interprétation des pages.
Anthology ID:
2008.jeptalnrecital-recital.14
Volume:
Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
June
Year:
2008
Address:
Avignon, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
130–139
Language:
French
URL:
https://aclanthology.org/2008.jeptalnrecital-recital.14
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2008.jeptalnrecital-recital.14.pdf