Densidées : calcul automatique de la densité des idées dans un corpus oral

Hyeran Lee, Philippe Gambette, Elsa Maillé, Constance Thuillier


Abstract
La densité des idées, qui correspond au ratio entre le nombre de propositions sémantiques et le nombre de mots dans un texte reflète la qualité informative des propositions langagières d’un texte. L’apparition de la maladie d’Alzheimer a été reliée à une dégradation de la densité des idées, ce qui explique l’intérêt pour un calcul automatique de cette mesure. Nous proposons une méthode basée sur un étiquetage morphosyntaxique et des règles d’ajustement, inspirée du logiciel CPIDR. Cette méthode a été validée sur un corpus de quarante entretiens oraux transcrits et obtient de meilleurs résultats pour le français que CPIDR pour l’anglais. Elle est implémentée dans le logiciel libre Densidées disponible sur http://code.google.com/p/densidees.
Anthology ID:
2010.jeptalnrecital-recital.2
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
July
Year:
2010
Address:
Montréal, Canada
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
11–20
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-recital.2
DOI:
Bibkey:
Cite (ACL):
Hyeran Lee, Philippe Gambette, Elsa Maillé, and Constance Thuillier. 2010. Densidées : calcul automatique de la densité des idées dans un corpus oral. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 11–20, Montréal, Canada. ATALA.
Cite (Informal):
Densidées : calcul automatique de la densité des idées dans un corpus oral (Lee et al., JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-recital.2.pdf