Apprentissage de plongements de mots dynamiques avec régularisation de la dérive (Learning dynamic word embeddings with drift regularisation)

Syrielle Montariol, Alexandre Allauzen


Abstract
L’usage, le sens et la connotation des mots peuvent changer au cours du temps. Les plongements lexicaux diachroniques permettent de modéliser ces changements de manière non supervisée. Dans cet article nous étudions l’impact de plusieurs fonctions de coût sur l’apprentissage de plongements dynamiques, en comparant les comportements de variantes du modèle Dynamic Bernoulli Embeddings. Les plongements dynamiques sont estimés sur deux corpus couvrant les mêmes deux décennies, le New York Times Annotated Corpus en anglais et une sélection d’articles du journal Le Monde en français, ce qui nous permet de mettre en place un processus d’analyse bilingue de l’évolution de l’usage des mots.
Anthology ID:
2019.jeptalnrecital-long.1
Volume:
Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume I : Articles longs
Month:
7
Year:
2019
Address:
Toulouse, France
Editors:
Emmanuel Morin, Sophie Rosset, Pierre Zweigenbaum
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
13–26
Language:
French
URL:
https://aclanthology.org/2019.jeptalnrecital-long.1
DOI:
Bibkey:
Cite (ACL):
Syrielle Montariol and Alexandre Allauzen. 2019. Apprentissage de plongements de mots dynamiques avec régularisation de la dérive (Learning dynamic word embeddings with drift regularisation). In Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume I : Articles longs, pages 13–26, Toulouse, France. ATALA.
Cite (Informal):
Apprentissage de plongements de mots dynamiques avec régularisation de la dérive (Learning dynamic word embeddings with drift regularisation) (Montariol & Allauzen, JEP/TALN/RECITAL 2019)
Copy Citation:
PDF:
https://aclanthology.org/2019.jeptalnrecital-long.1.pdf