@inproceedings{maisonneuve-etal-2024-apprentissage,
title = "Apprentissage profond pour l{'}analyse de la parole pathologique : {\'e}tude comparative entre mod{\`e}les {CNN} et {\`a} base de transformers",
author = "Maisonneuve, Malo and
Fredouille, Corinne and
Lalain, Muriel and
Ghio, Alain and
Woisard, Virginie",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes des 35{\`e}mes Journ{\'e}es d'{\'E}tudes sur la Parole",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-jep.27",
pages = "261--270",
abstract = "Les cancers des voies a{\'e}rodigestives sup{\'e}rieures (VADS) ont un impact significatif sur la capacit{\'e} des patients {\`a} s{'}exprimer, ce qui affecte leur qualit{\'e} de vie. Les {\'e}valuations actuelles de la parole pathologique sont subjectives, justifiant le besoin de m{\'e}thodes automatiques et objectives. Un mod{\`e}le auto-supervis{\'e} bas{\'e} sur Wav2Vec2 est propos{\'e} pour la classification de phon{\`e}mes chez les patients atteints de cancer des VADS, visant une am{\'e}lioration des taux de bonne classification et une meilleure discrimination des caract{\'e}ristiques phon{\'e}tiques. Les impacts des param{\`e}tres d{'}affinage, des donn{\'e}es de pr{\'e}-entra{\^\i}nement, de la taille du mod{\`e}le et des donn{\'e}es d{'}affinage sont explor{\'e}s. Nos r{\'e}sultats montrent que l{'}architecture Wav2Vec2 surpasse une approche bas{\'e}e sur un CNN, et montre une corr{\'e}lation significative avec les mesures perceptives. Ce travail ouvre la voie {\`a} une meilleure compr{\'e}hension de la parole pathologique, via une repr{\'e}sentation auto-apprise de la parole, tr{\`e}s pertinente pour des approches d{'}interpr{\'e}tation {\`a} destination des cliniciens.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="maisonneuve-etal-2024-apprentissage">
<titleInfo>
<title>Apprentissage profond pour l’analyse de la parole pathologique : étude comparative entre modèles CNN et à base de transformers</title>
</titleInfo>
<name type="personal">
<namePart type="given">Malo</namePart>
<namePart type="family">Maisonneuve</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Corinne</namePart>
<namePart type="family">Fredouille</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Muriel</namePart>
<namePart type="family">Lalain</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Alain</namePart>
<namePart type="family">Ghio</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Virginie</namePart>
<namePart type="family">Woisard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 35èmes Journées d’Études sur la Parole</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les cancers des voies aérodigestives supérieures (VADS) ont un impact significatif sur la capacité des patients à s’exprimer, ce qui affecte leur qualité de vie. Les évaluations actuelles de la parole pathologique sont subjectives, justifiant le besoin de méthodes automatiques et objectives. Un modèle auto-supervisé basé sur Wav2Vec2 est proposé pour la classification de phonèmes chez les patients atteints de cancer des VADS, visant une amélioration des taux de bonne classification et une meilleure discrimination des caractéristiques phonétiques. Les impacts des paramètres d’affinage, des données de pré-entraînement, de la taille du modèle et des données d’affinage sont explorés. Nos résultats montrent que l’architecture Wav2Vec2 surpasse une approche basée sur un CNN, et montre une corrélation significative avec les mesures perceptives. Ce travail ouvre la voie à une meilleure compréhension de la parole pathologique, via une représentation auto-apprise de la parole, très pertinente pour des approches d’interprétation à destination des cliniciens.</abstract>
<identifier type="citekey">maisonneuve-etal-2024-apprentissage</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-jep.27</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>261</start>
<end>270</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Apprentissage profond pour l’analyse de la parole pathologique : étude comparative entre modèles CNN et à base de transformers
%A Maisonneuve, Malo
%A Fredouille, Corinne
%A Lalain, Muriel
%A Ghio, Alain
%A Woisard, Virginie
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes des 35èmes Journées d’Études sur la Parole
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G French
%F maisonneuve-etal-2024-apprentissage
%X Les cancers des voies aérodigestives supérieures (VADS) ont un impact significatif sur la capacité des patients à s’exprimer, ce qui affecte leur qualité de vie. Les évaluations actuelles de la parole pathologique sont subjectives, justifiant le besoin de méthodes automatiques et objectives. Un modèle auto-supervisé basé sur Wav2Vec2 est proposé pour la classification de phonèmes chez les patients atteints de cancer des VADS, visant une amélioration des taux de bonne classification et une meilleure discrimination des caractéristiques phonétiques. Les impacts des paramètres d’affinage, des données de pré-entraînement, de la taille du modèle et des données d’affinage sont explorés. Nos résultats montrent que l’architecture Wav2Vec2 surpasse une approche basée sur un CNN, et montre une corrélation significative avec les mesures perceptives. Ce travail ouvre la voie à une meilleure compréhension de la parole pathologique, via une représentation auto-apprise de la parole, très pertinente pour des approches d’interprétation à destination des cliniciens.
%U https://aclanthology.org/2024.jeptalnrecital-jep.27
%P 261-270
Markdown (Informal)
[Apprentissage profond pour l’analyse de la parole pathologique : étude comparative entre modèles CNN et à base de transformers](https://aclanthology.org/2024.jeptalnrecital-jep.27) (Maisonneuve et al., JEP/TALN/RECITAL 2024)
ACL