Évaluation des taux de synonymie et de polysémie dans un texte

Claude De Loupy


Abstract
La polysémie et la synonymie sont deux aspects fondamentaux de la langue. Nous présentons ici une évaluation de l’importance de ces deux phénomènes à l’aide de statistiques basées sur le lexique WordNet et sur le SemCor. Ainsi, on a un taux de polysémie théorique de 5 sens par mot dans le SemCor. Mais si on regarde les occurrences réelles, moins de 50 % des sens possibles sont utilisés. De même, s’il y a, en moyenne, 2,7 mots possibles pour désigner un concept qui apparaît dans le corpus, plus de la moitié d’entre eux ne sont jamais utilisés. Ces résultats relativisent l’utilité de telles ressources sémantiques pour le traitement de la langue.
Anthology ID:
2002.jeptalnrecital-long.20
Volume:
Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2002
Address:
Nancy, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
227–236
Language:
French
URL:
https://aclanthology.org/2002.jeptalnrecital-long.20
DOI:
Bibkey:
Cite (ACL):
Claude De Loupy. 2002. Évaluation des taux de synonymie et de polysémie dans un texte. In Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 227–236, Nancy, France. ATALA.
Cite (Informal):
Évaluation des taux de synonymie et de polysémie dans un texte (De Loupy, JEP/TALN/RECITAL 2002)
Copy Citation:
PDF:
https://aclanthology.org/2002.jeptalnrecital-long.20.pdf