Outil Interactif et Évolutif pour l’Extraction d’Information dans des Documents Techniques (Interactive and Evolutive Tool for Information Extraction in Technical Documents)

Thiziri Belkacem, Charles Teissèdre


Abstract
L’accès à l’information dans la documentation technique est une application particulière et complexe du traitement du langage naturel et de la recherche d’information. La difficulté tient aux contraintes propres des langages métier spécialisés et semi-contrôlés. Dans ce document, nous proposons un outil d’accès à l’information dans différents types de documents. Notre solution exploite conjointement la structure organisationnelle des documents et leur contenu informationnel, pour extraire des informations métier dans des différents corpus. Nous proposons un système basé sur des interactions expert-machine dans un cycle d’amélioration continu des modèles d’extraction. Notre approche exploite des modèles d’apprentissage à faible supervision ne nécessitant pas d’expertise en ingénierie des langues. Notre système intègre l’utilisateur dans le processus de qualification de l’information et permet de guider son apprentissage, afin de rendre ses modèles plus performants au fil du temps.
Anthology ID:
2021.jeptalnrecital-demo.4
Volume:
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 : Démonstrations
Month:
6
Year:
2021
Address:
Lille, France
Editors:
Pascal Denis, Natalia Grabar, Amel Fraisse, Rémi Cardon, Bernard Jacquemin, Eric Kergosien, Antonio Balvet
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
12–14
Language:
French
URL:
https://aclanthology.org/2021.jeptalnrecital-demo.4
DOI:
Bibkey:
Cite (ACL):
Thiziri Belkacem and Charles Teissèdre. 2021. Outil Interactif et Évolutif pour l’Extraction d’Information dans des Documents Techniques (Interactive and Evolutive Tool for Information Extraction in Technical Documents). In Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 : Démonstrations, pages 12–14, Lille, France. ATALA.
Cite (Informal):
Outil Interactif et Évolutif pour l’Extraction d’Information dans des Documents Techniques (Interactive and Evolutive Tool for Information Extraction in Technical Documents) (Belkacem & Teissèdre, JEP/TALN/RECITAL 2021)
Copy Citation:
PDF:
https://aclanthology.org/2021.jeptalnrecital-demo.4.pdf