Utilisation de relations sémantiques pour améliorer la segmentation thématique de documents télévisuels

Camille Guinaudeau, Guillaume Gravier, Pascale Sébillot


Abstract
Les méthodes de segmentation thématique exploitant une mesure de la cohésion lexicale peuvent être appliquées telles quelles à des transcriptions automatiques de programmes télévisuels. Cependant, elles sont moins efficaces dans ce contexte, ne prenant en compte ni les particularités des émissions TV, ni celles des transcriptions. Nous étudions ici l’apport de relations sémantiques pour rendre les techniques de segmentation thématique plus robustes. Nous proposons une méthode pour exploiter ces relations dans une mesure de la cohésion lexicale et montrons qu’elles permettent d’augmenter la F1-mesure de +1.97 et +11.83 sur deux corpus composés respectivement de 40h de journaux télévisés et de 40h d’émissions de reportage. Ces améliorations démontrent que les relations sémantiques peuvent rendre les méthodes de segmentation moins sensibles aux erreurs de transcription et au manque de répétitions constaté dans certaines émissions télévisées.
Anthology ID:
2010.jeptalnrecital-long.22
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
211–220
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.22
DOI:
Bibkey:
Cite (ACL):
Camille Guinaudeau, Guillaume Gravier, and Pascale Sébillot. 2010. Utilisation de relations sémantiques pour améliorer la segmentation thématique de documents télévisuels. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 211–220, Montréal, Canada. ATALA.
Cite (Informal):
Utilisation de relations sémantiques pour améliorer la segmentation thématique de documents télévisuels (Guinaudeau et al., JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-long.22.pdf