Nouvelle tâche sémantique pour le corpus de compréhension de parole en français MEDIA

Nadège Alavoine, Gaëlle Laperrière, Christophe Servan, Sahar Ghannay, Sophie Rosset


Abstract
La détection d’intention et de concepts sont des tâches essentielles de la compréhension de la parole(SLU). Or il n’existe que peu de données annotées en français permettant d’effectuer ces deux tâches conjointement. Cependant, il existe des ensembles de données annotées en concept, dont le corpus MEDIA. Ce corpus est considéré comme l’un des plus difficiles. Néanmoins, il ne comporte que des annotations en concepts et pas en intentions. Dans cet article, nous proposons une version étendue de MEDIA annotée en intentions pour étendre son utilisation. Cet article présente une méthode semi-automatique pour obtenir cette version étendue. De plus, nous présentons les premiers résultats des expériences menées sur cet ensemble de données en utilisant des modèles joints pour la classification des intentions et la détection de concepts.
Anthology ID:
2024.jeptalnrecital-jep.48
Volume:
Actes des 35èmes Journées d'Études sur la Parole
Month:
7
Year:
2024
Address:
Toulouse, France
Editors:
Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-dac, Julie Mauclair, Jose G Moreno, Julien Pinquier
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA and AFPC
Note:
Pages:
470–480
Language:
French
URL:
https://aclanthology.org/2024.jeptalnrecital-jep.48
DOI:
Bibkey:
Cite (ACL):
Nadège Alavoine, Gaëlle Laperrière, Christophe Servan, Sahar Ghannay, and Sophie Rosset. 2024. Nouvelle tâche sémantique pour le corpus de compréhension de parole en français MEDIA. In Actes des 35èmes Journées d'Études sur la Parole, pages 470–480, Toulouse, France. ATALA and AFPC.
Cite (Informal):
Nouvelle tâche sémantique pour le corpus de compréhension de parole en français MEDIA (Alavoine et al., JEP/TALN/RECITAL 2024)
Copy Citation:
PDF:
https://aclanthology.org/2024.jeptalnrecital-jep.48.pdf