@inproceedings{guillot-etal-2023-de,
title = "De l`interpr{\'e}tabilit{\'e} des dimensions {\`a} l`interpr{\'e}tabilit{\'e} du vecteur : parcimonie et stabilit{\'e}",
author = "Guillot, Simon and
Prouteau, Thibault and
Dugue, Nicolas",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles d{\'e}j{\`a} soumis ou accept{\'e}s en conf{\'e}rence internationale",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-international.10/",
pages = "83--91",
language = "fra",
abstract = "Les mod{\`e}les d`apprentissage de plongements parcimonieux (SPINE, SINr) ont pour objectif de produire un espace dont les dimensions peuvent {\^e}tre interpr{\'e}t{\'e}es. Ces mod{\`e}les visent des cas d`application critiques du traitement de la langue naturelle (usages m{\'e}dicaux ou judiciaires) et une utilisation des repr{\'e}sentations dans le cadre des humanit{\'e}s num{\'e}riques. Nous proposons de consid{\'e}rer non plus seulement l`interpr{\'e}tabilit{\'e} des dimensions de l`espace de description, mais celle des vecteurs de mots en eux-m{\^e}mes. Pour cela, nous introduisons un cadre d'{\'e}valuation incluant le crit{\`e}re de stabilit{\'e}, et red{\'e}finissant celui de la parcimonie en accord avec les th{\'e}ories psycholinguistiques. Tout d`abord, les {\'e}valuations en stabilit{\'e} indiquent une faible variabilit{\'e} sur les mod{\`e}les consid{\'e}r{\'e}s. Ensuite, pour red{\'e}finir le crit{\`e}re de parcimonie, nous proposons une m{\'e}thode d'{\'e}parsification des vecteurs de plongements en gardant les composantes les plus fortement activ{\'e}es de chaque vecteur. Il appara{\^i}t que pour les deux mod{\`e}les SPINE et SINr, de bonnes performances en similarit{\'e} sont permises par des vecteurs avec un tr{\`e}s faible nombre de dimensions activ{\'e}es. Ces r{\'e}sultats permettent d`envisager l`interpr{\'e}tabilit{\'e} de repr{\'e}sentations {\'e}parses sans remettre en cause les performances."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="guillot-etal-2023-de">
<titleInfo>
<title>De l‘interprétabilité des dimensions à l‘interprétabilité du vecteur : parcimonie et stabilité</title>
</titleInfo>
<name type="personal">
<namePart type="given">Simon</namePart>
<namePart type="family">Guillot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thibault</namePart>
<namePart type="family">Prouteau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nicolas</namePart>
<namePart type="family">Dugue</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Servan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anne</namePart>
<namePart type="family">Vilnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les modèles d‘apprentissage de plongements parcimonieux (SPINE, SINr) ont pour objectif de produire un espace dont les dimensions peuvent être interprétées. Ces modèles visent des cas d‘application critiques du traitement de la langue naturelle (usages médicaux ou judiciaires) et une utilisation des représentations dans le cadre des humanités numériques. Nous proposons de considérer non plus seulement l‘interprétabilité des dimensions de l‘espace de description, mais celle des vecteurs de mots en eux-mêmes. Pour cela, nous introduisons un cadre d’évaluation incluant le critère de stabilité, et redéfinissant celui de la parcimonie en accord avec les théories psycholinguistiques. Tout d‘abord, les évaluations en stabilité indiquent une faible variabilité sur les modèles considérés. Ensuite, pour redéfinir le critère de parcimonie, nous proposons une méthode d’éparsification des vecteurs de plongements en gardant les composantes les plus fortement activées de chaque vecteur. Il apparaît que pour les deux modèles SPINE et SINr, de bonnes performances en similarité sont permises par des vecteurs avec un très faible nombre de dimensions activées. Ces résultats permettent d‘envisager l‘interprétabilité de représentations éparses sans remettre en cause les performances.</abstract>
<identifier type="citekey">guillot-etal-2023-de</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-international.10/</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>83</start>
<end>91</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T De l‘interprétabilité des dimensions à l‘interprétabilité du vecteur : parcimonie et stabilité
%A Guillot, Simon
%A Prouteau, Thibault
%A Dugue, Nicolas
%Y Servan, Christophe
%Y Vilnat, Anne
%S Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale
%D 2023
%8 June
%I ATALA
%C Paris, France
%G fra
%F guillot-etal-2023-de
%X Les modèles d‘apprentissage de plongements parcimonieux (SPINE, SINr) ont pour objectif de produire un espace dont les dimensions peuvent être interprétées. Ces modèles visent des cas d‘application critiques du traitement de la langue naturelle (usages médicaux ou judiciaires) et une utilisation des représentations dans le cadre des humanités numériques. Nous proposons de considérer non plus seulement l‘interprétabilité des dimensions de l‘espace de description, mais celle des vecteurs de mots en eux-mêmes. Pour cela, nous introduisons un cadre d’évaluation incluant le critère de stabilité, et redéfinissant celui de la parcimonie en accord avec les théories psycholinguistiques. Tout d‘abord, les évaluations en stabilité indiquent une faible variabilité sur les modèles considérés. Ensuite, pour redéfinir le critère de parcimonie, nous proposons une méthode d’éparsification des vecteurs de plongements en gardant les composantes les plus fortement activées de chaque vecteur. Il apparaît que pour les deux modèles SPINE et SINr, de bonnes performances en similarité sont permises par des vecteurs avec un très faible nombre de dimensions activées. Ces résultats permettent d‘envisager l‘interprétabilité de représentations éparses sans remettre en cause les performances.
%U https://aclanthology.org/2023.jeptalnrecital-international.10/
%P 83-91
Markdown (Informal)
[De l’interprétabilité des dimensions à l’interprétabilité du vecteur : parcimonie et stabilité](https://aclanthology.org/2023.jeptalnrecital-international.10/) (Guillot et al., JEP/TALN/RECITAL 2023)
ACL