@inproceedings{connes-dugue-2019-apprentissage,
title = "Apprentissage de plongements lexicaux par une approche r{\'e}seaux complexes (Complex networks based word embeddings)",
author = "Connes, Victor and
Dugu{\'e}, Nicolas",
editor = "Morin, Emmanuel and
Rosset, Sophie and
Zweigenbaum, Pierre",
booktitle = "Actes de la Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume I : Articles longs",
month = "7",
year = "2019",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://aclanthology.org/2019.jeptalnrecital-long.2",
pages = "27--38",
abstract = {La litt{\'e}rature des r{\'e}seaux complexes a montr{\'e} la pertinence de l{'}{\'e}tude de la langue sous forme de r{\'e}seau pour diff{\'e}rentes applications : d{\'e}sambigu{\"\i}sation, r{\'e}sum{\'e} automatique, classification des langues, etc. Cette m{\^e}me litt{\'e}rature a d{\'e}montr{\'e} que les r{\'e}seaux de co-occurrences de mots poss{\`e}dent une structure de communaut{\'e}s latente. Nous formulons l{'}hypoth{\`e}se que cette structuration du r{\'e}seau sous forme de communaut{\'e}s est utile pour travailler sur la s{\'e}mantique d{'}une langue et introduisons donc dans cet article une m{\'e}thode d{'}apprentissage de plongements originale bas{\'e}e sur cette hypoth{\`e}se. Cette hypoth{\`e}se est coh{\'e}rente avec la proximit{\'e} qui existe entre la d{\'e}tection de communaut{\'e}s sur un r{\'e}seau de co-occurrences et la factorisation d{'}une matrice de co-occurrences, m{\'e}thode couramment utilis{\'e}e pour l{'}apprentissage de plongements lexicaux. Nous d{\'e}crivons notre m{\'e}thode structur{\'e}e en trois {\'e}tapes : construction et pr{\'e}-traitement du r{\'e}seau, d{\'e}tection de la structure de communaut{\'e}s, construction des plongements de mots {\`a} partir de cette structure. Apr{\`e}s avoir d{\'e}crit cette nouvelle m{\'e}thodologie, nous montrons la pertinence de notre approche avec des premiers r{\'e}sultats d{'}{\'e}valuation sur les t{\^a}ches de cat{\'e}gorisation et de similarit{\'e}. Enfin, nous discutons des perspectives importantes d{'}un tel mod{\`e}le issu des r{\'e}seaux complexes : les dimensions du mod{\`e}le (les communaut{\'e}s) semblent interpr{\'e}tables, l{'}apprentissage est rapide, la construction d{'}un nouveau plongement est presque instantan{\'e}e, et il est envisageable d{'}en exp{\'e}rimenter une version incr{\'e}mentale pour travailler sur des corpus textuels temporels.},
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="connes-dugue-2019-apprentissage">
<titleInfo>
<title>Apprentissage de plongements lexicaux par une approche réseaux complexes (Complex networks based word embeddings)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Victor</namePart>
<namePart type="family">Connes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nicolas</namePart>
<namePart type="family">Dugué</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2019-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume I : Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Morin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Sophie</namePart>
<namePart type="family">Rosset</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Pierre</namePart>
<namePart type="family">Zweigenbaum</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La littérature des réseaux complexes a montré la pertinence de l’étude de la langue sous forme de réseau pour différentes applications : désambiguïsation, résumé automatique, classification des langues, etc. Cette même littérature a démontré que les réseaux de co-occurrences de mots possèdent une structure de communautés latente. Nous formulons l’hypothèse que cette structuration du réseau sous forme de communautés est utile pour travailler sur la sémantique d’une langue et introduisons donc dans cet article une méthode d’apprentissage de plongements originale basée sur cette hypothèse. Cette hypothèse est cohérente avec la proximité qui existe entre la détection de communautés sur un réseau de co-occurrences et la factorisation d’une matrice de co-occurrences, méthode couramment utilisée pour l’apprentissage de plongements lexicaux. Nous décrivons notre méthode structurée en trois étapes : construction et pré-traitement du réseau, détection de la structure de communautés, construction des plongements de mots à partir de cette structure. Après avoir décrit cette nouvelle méthodologie, nous montrons la pertinence de notre approche avec des premiers résultats d’évaluation sur les tâches de catégorisation et de similarité. Enfin, nous discutons des perspectives importantes d’un tel modèle issu des réseaux complexes : les dimensions du modèle (les communautés) semblent interprétables, l’apprentissage est rapide, la construction d’un nouveau plongement est presque instantanée, et il est envisageable d’en expérimenter une version incrémentale pour travailler sur des corpus textuels temporels.</abstract>
<identifier type="citekey">connes-dugue-2019-apprentissage</identifier>
<location>
<url>https://aclanthology.org/2019.jeptalnrecital-long.2</url>
</location>
<part>
<date>2019-7</date>
<extent unit="page">
<start>27</start>
<end>38</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Apprentissage de plongements lexicaux par une approche réseaux complexes (Complex networks based word embeddings)
%A Connes, Victor
%A Dugué, Nicolas
%Y Morin, Emmanuel
%Y Rosset, Sophie
%Y Zweigenbaum, Pierre
%S Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume I : Articles longs
%D 2019
%8 July
%I ATALA
%C Toulouse, France
%G French
%F connes-dugue-2019-apprentissage
%X La littérature des réseaux complexes a montré la pertinence de l’étude de la langue sous forme de réseau pour différentes applications : désambiguïsation, résumé automatique, classification des langues, etc. Cette même littérature a démontré que les réseaux de co-occurrences de mots possèdent une structure de communautés latente. Nous formulons l’hypothèse que cette structuration du réseau sous forme de communautés est utile pour travailler sur la sémantique d’une langue et introduisons donc dans cet article une méthode d’apprentissage de plongements originale basée sur cette hypothèse. Cette hypothèse est cohérente avec la proximité qui existe entre la détection de communautés sur un réseau de co-occurrences et la factorisation d’une matrice de co-occurrences, méthode couramment utilisée pour l’apprentissage de plongements lexicaux. Nous décrivons notre méthode structurée en trois étapes : construction et pré-traitement du réseau, détection de la structure de communautés, construction des plongements de mots à partir de cette structure. Après avoir décrit cette nouvelle méthodologie, nous montrons la pertinence de notre approche avec des premiers résultats d’évaluation sur les tâches de catégorisation et de similarité. Enfin, nous discutons des perspectives importantes d’un tel modèle issu des réseaux complexes : les dimensions du modèle (les communautés) semblent interprétables, l’apprentissage est rapide, la construction d’un nouveau plongement est presque instantanée, et il est envisageable d’en expérimenter une version incrémentale pour travailler sur des corpus textuels temporels.
%U https://aclanthology.org/2019.jeptalnrecital-long.2
%P 27-38
Markdown (Informal)
[Apprentissage de plongements lexicaux par une approche réseaux complexes (Complex networks based word embeddings)](https://aclanthology.org/2019.jeptalnrecital-long.2) (Connes & Dugué, JEP/TALN/RECITAL 2019)
ACL