Etude des répétitions en français parlé spontané pour les technologies de la parole

Sandrine Henry


Abstract
Cet article rapporte les résultats d’une étude quantitative des répétitions menée à partir d’un corpus de français parlé spontané d’un million de mots, étude réalisée dans le cadre de notre première année de thèse. L’étude linguistique pourra aider à l’amélioration des systèmes de reconnaissance de la parole et de l’étiquetage grammatical automatique de corpus oraux. Ces technologies impliquent la prise en compte et l’étude des répétitions de performance (en opposition aux répétitions de compétence, telles que nous nous sujet + complément) afin de pouvoir, par la suite, les « gommer » avant des traitements ultérieurs. Nos résultats montrent que les répétitions de performance concernent principalement les mots-outils et apparaissent à des frontières syntaxiques majeures.
Anthology ID:
2002.jeptalnrecital-recital.7
Volume:
Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
June
Year:
2002
Address:
Nancy, France
Editor:
Azim Roussanaly
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
465–474
Language:
French
URL:
https://aclanthology.org/2002.jeptalnrecital-recital.7
DOI:
Bibkey:
Cite (ACL):
Sandrine Henry. 2002. Etude des répétitions en français parlé spontané pour les technologies de la parole. In Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 465–474, Nancy, France. ATALA.
Cite (Informal):
Etude des répétitions en français parlé spontané pour les technologies de la parole (Henry, JEP/TALN/RECITAL 2002)
Copy Citation:
PDF:
https://aclanthology.org/2002.jeptalnrecital-recital.7.pdf