Le corpus « Machine Translation » : une exploration diachronique des (méta)données Istex

Mathilde Huguin, Sabine Barreaux


Abstract
Le corpus Machine Translation se compose de publications scientifiques issues du réservoir Istex. Conçu comme un cas d’usage, il permet d’explorer l’histoire de la traduction automatique au travers des métadonnées et des textes intégraux disponibles pour chacun de ses documents. D’une part, les métadonnées permettent d’apporter un premier regard sur le paysage de la traduction automatique grâce à des tableaux de bord bibliométriques. D’autre part, l’utilisation d’outils de fouille de textes sur le texte intégral rend saillantes des informations inaccessibles sans une lecture approfondie des articles. L’exploration du corpus est réalisée grâce à Lodex, logiciel open source dédié à la valorisation de données structurées.
Anthology ID:
2023.jeptalnrecital-arts.9
Volume:
Actes de CORIA-TALN 2023. Actes de l'atelier "Analyse et Recherche de Textes Scientifiques" (ARTS)@TALN 2023
Month:
6
Year:
2023
Address:
Paris, France
Editors:
Florian Boudin, Béatrice Daille, Richard Dufour, Oumaima El, Maël Houbre, Léane Jourdan, Nihel Kooli
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
54–59
Language:
French
URL:
https://aclanthology.org/2023.jeptalnrecital-arts.9
DOI:
Bibkey:
Cite (ACL):
Mathilde Huguin and Sabine Barreaux. 2023. Le corpus « Machine Translation » : une exploration diachronique des (méta)données Istex. In Actes de CORIA-TALN 2023. Actes de l'atelier "Analyse et Recherche de Textes Scientifiques" (ARTS)@TALN 2023, pages 54–59, Paris, France. ATALA.
Cite (Informal):
Le corpus « Machine Translation » : une exploration diachronique des (méta)données Istex (Huguin & Barreaux, JEP/TALN/RECITAL 2023)
Copy Citation:
PDF:
https://aclanthology.org/2023.jeptalnrecital-arts.9.pdf