@inproceedings{zweigenbaum-grabar-2002-accentuation,
title = "Accentuation de mots inconnus : application au thesaurus biom{\'e}dical {M}e{SH}",
author = "Zweigenbaum, Pierre and
Grabar, Natalia",
editor = "Pierrel, Jean-Marie",
booktitle = "Actes de la 9{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2002",
address = "Nancy, France",
publisher = "ATALA",
url = "https://aclanthology.org/2002.jeptalnrecital-long.3",
pages = "53--62",
abstract = "Certaines ressources textuelles ou terminologiques sont {\'e}crites sans signes diacritiques, ce qui freine leur utilisation pour le traitement automatique des langues. Dans un domaine sp{\'e}cialis{\'e} comme la m{\'e}decine, il est fr{\'e}quent que les mots rencontr{\'e}s ne se trouvent pas dans les lexiques {\'e}lectroniques disponibles. Se pose alors la question de l{'}accentuation de mots inconnus : c{'}est le sujet de ce travail. Nous proposons deux m{\'e}thodes d{'}accentuation de mots inconnus fond{\'e}es sur un apprentissage par observation des contextes d{'}occurrence des lettres {\`a} accentuer dans un ensemble de mots d{'}entra{\^\i}nement, l{'}une adapt{\'e}e de l{'}{\'e}tiquetage morphosyntaxique, l{'}autre adapt{\'e}e d{'}une m{\'e}thode d{'}apprentissage de r{\`e}gles morphologiques. Nous pr{\'e}sentons des r{\'e}sultats exp{\'e}rimentaux pour la lettre e sur un thesaurus biom{\'e}dical en fran{\c{c}}ais : le MeSH. Ces m{\'e}thodes obtiennent une pr{\'e}cision de 86 {\`a} 96 {\%} (+-4 {\%}) pour un rappel allant de 72 {\`a} 86 {\%}.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="zweigenbaum-grabar-2002-accentuation">
<titleInfo>
<title>Accentuation de mots inconnus : application au thesaurus biomédical MeSH</title>
</titleInfo>
<name type="personal">
<namePart type="given">Pierre</namePart>
<namePart type="family">Zweigenbaum</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Natalia</namePart>
<namePart type="family">Grabar</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2002-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jean-Marie</namePart>
<namePart type="family">Pierrel</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Nancy, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Certaines ressources textuelles ou terminologiques sont écrites sans signes diacritiques, ce qui freine leur utilisation pour le traitement automatique des langues. Dans un domaine spécialisé comme la médecine, il est fréquent que les mots rencontrés ne se trouvent pas dans les lexiques électroniques disponibles. Se pose alors la question de l’accentuation de mots inconnus : c’est le sujet de ce travail. Nous proposons deux méthodes d’accentuation de mots inconnus fondées sur un apprentissage par observation des contextes d’occurrence des lettres à accentuer dans un ensemble de mots d’entraînement, l’une adaptée de l’étiquetage morphosyntaxique, l’autre adaptée d’une méthode d’apprentissage de règles morphologiques. Nous présentons des résultats expérimentaux pour la lettre e sur un thesaurus biomédical en français : le MeSH. Ces méthodes obtiennent une précision de 86 à 96 % (+-4 %) pour un rappel allant de 72 à 86 %.</abstract>
<identifier type="citekey">zweigenbaum-grabar-2002-accentuation</identifier>
<location>
<url>https://aclanthology.org/2002.jeptalnrecital-long.3</url>
</location>
<part>
<date>2002-06</date>
<extent unit="page">
<start>53</start>
<end>62</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Accentuation de mots inconnus : application au thesaurus biomédical MeSH
%A Zweigenbaum, Pierre
%A Grabar, Natalia
%Y Pierrel, Jean-Marie
%S Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2002
%8 June
%I ATALA
%C Nancy, France
%G French
%F zweigenbaum-grabar-2002-accentuation
%X Certaines ressources textuelles ou terminologiques sont écrites sans signes diacritiques, ce qui freine leur utilisation pour le traitement automatique des langues. Dans un domaine spécialisé comme la médecine, il est fréquent que les mots rencontrés ne se trouvent pas dans les lexiques électroniques disponibles. Se pose alors la question de l’accentuation de mots inconnus : c’est le sujet de ce travail. Nous proposons deux méthodes d’accentuation de mots inconnus fondées sur un apprentissage par observation des contextes d’occurrence des lettres à accentuer dans un ensemble de mots d’entraînement, l’une adaptée de l’étiquetage morphosyntaxique, l’autre adaptée d’une méthode d’apprentissage de règles morphologiques. Nous présentons des résultats expérimentaux pour la lettre e sur un thesaurus biomédical en français : le MeSH. Ces méthodes obtiennent une précision de 86 à 96 % (+-4 %) pour un rappel allant de 72 à 86 %.
%U https://aclanthology.org/2002.jeptalnrecital-long.3
%P 53-62
Markdown (Informal)
[Accentuation de mots inconnus : application au thesaurus biomédical MeSH](https://aclanthology.org/2002.jeptalnrecital-long.3) (Zweigenbaum & Grabar, JEP/TALN/RECITAL 2002)
ACL