Identification du locuteur : ouvrir la boîte noire

Carole Millot, Cédric Gendrot, Jean-François Bonastre


Abstract
L’explicabilité des systèmes relevant du deep learning est devenue un enjeu central ces dernières années, dans le droit européen comme le domaine criminalistique. L’approche BA-LR introduit en identification du locuteur un nouveau paradigme de modélisation : elle fait émerger automatiquement les attributs partagés par un groupe de locuteurs et qui sous-entendent la discrimination de ceux-ci. Le score produit est décomposable au niveau des attributs, ce qui augmente significativement l’explicabilité de la méthode. Cette étude propose de compléter la caractérisation des attributs obtenus par le BA-LR, à l’aide de paramètres de qualité de voix. L’analyse suggère que plusieurs attributs utilisent les types de phonation pour regrouper les locuteurs, ceux-ci encodant des informations humainement perceptibles. Cet article pose ainsi des bases pour l’analyse acoustique des attributs, qui permettra à terme d’utiliser le BA-LR dans le cadre du profilage vocal.
Anthology ID:
2024.jeptalnrecital-jep.10
Volume:
Actes des 35èmes Journées d'Études sur la Parole
Month:
7
Year:
2024
Address:
Toulouse, France
Editors:
Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-dac, Julie Mauclair, Jose G Moreno, Julien Pinquier
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA and AFPC
Note:
Pages:
92–101
Language:
French
URL:
https://aclanthology.org/2024.jeptalnrecital-jep.10
DOI:
Bibkey:
Cite (ACL):
Carole Millot, Cédric Gendrot, and Jean-François Bonastre. 2024. Identification du locuteur : ouvrir la boîte noire. In Actes des 35èmes Journées d'Études sur la Parole, pages 92–101, Toulouse, France. ATALA and AFPC.
Cite (Informal):
Identification du locuteur : ouvrir la boîte noire (Millot et al., JEP/TALN/RECITAL 2024)
Copy Citation:
PDF:
https://aclanthology.org/2024.jeptalnrecital-jep.10.pdf