Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales

Sebastiao Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, Julien Pinquier


Abstract
Dans le contexte des troubles de la parole, l’une des tâches du thérapeute est de définir l’intelligibilité de la parole du patient. Les systèmes automatiques peuvent aider dans cette tâche, mais dans la plupart des cas, ils sont entraînés dans des environnements spécifiques et contrôlés, avec des conditions propres qui ne reflètent pas un environnement médical. Dans cet article, nous développons un système automatique qui prédit l’intelligibilité de la parole à partir de données provennant de patients ayant un cancer de la tête et du cou obtenues dans des conditions cliniques. Ce système repose sur des représentations de locuteurs entraînées selon une méthodologie multi-tâches pour prédire simultanément l’intelligibilité de la parole et la sévérité des troubles de la parole. Il atteint une corrélation allant jusqu’à 0,891 pour une tâche de lecture. De plus, il affiche des résultats prometteurs sur de la parole spontanée, qui est une tâche plus écologique mais sous-étudiée et pourtant essentielle pour un déploiement direct d’un système automatique dans un environnement hospitalier.
Anthology ID:
2024.jeptalnrecital-jep.11
Volume:
Actes des 35èmes Journées d'Études sur la Parole
Month:
7
Year:
2024
Address:
Toulouse, France
Editors:
Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-dac, Julie Mauclair, Jose G Moreno, Julien Pinquier
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA and AFPC
Note:
Pages:
102–111
Language:
French
URL:
https://aclanthology.org/2024.jeptalnrecital-jep.11
DOI:
Bibkey:
Cite (ACL):
Sebastiao Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard, and Julien Pinquier. 2024. Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales. In Actes des 35èmes Journées d'Études sur la Parole, pages 102–111, Toulouse, France. ATALA and AFPC.
Cite (Informal):
Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales (Quintas et al., JEP/TALN/RECITAL 2024)
Copy Citation:
PDF:
https://aclanthology.org/2024.jeptalnrecital-jep.11.pdf