@inproceedings{koptient-2020-la,
title = "La d{\'e}sambiguisation des abr{\'e}viations du domaine m{\'e}dical (Disambiguation of abbreviations from the medical domain)",
author = {Koptient, Ana{\"\i}s},
editor = "Benzitoun, Christophe and
Braud, Chlo{\'e} and
Huber, Laurine and
Langlois, David and
Ouni, Slim and
Pogodalla, Sylvain and
Schneider, St{\'e}phane",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 3 : Rencontre des {\'E}tudiants Chercheurs en Informatique pour le TAL",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://aclanthology.org/2020.jeptalnrecital-recital.12",
pages = "151--163",
abstract = {Les abr{\'e}viations, tout en {\'e}tant r{\'e}pandues dans la langue, ont une s{\'e}mantique assez opaque car seulement les premi{\`e}res lettres sont transparentes. Cela peut donc emp{\^e}cher la compr{\'e}hension des abr{\'e}viations, et des textes qui les contiennent, par les locuteurs. De plus, certaines abr{\'e}viations sont ambigu{\"e}s en ayant plusieurs sens possibles, ce qui augmente la difficult{\'e} de leur compr{\'e}hension. Nous proposons de travailler avec les abr{\'e}viations de la langue m{\'e}dicale dans un cadre li{\'e} {\`a} la simplification automatique de textes. Dans le processus de simplification, il faut en effet choisir la forme {\'e}tendue des abr{\'e}viations qui soit correcte pour un contexte donn{\'e}. Nous proposons de traiter la d{\'e}sambigu{\"\i}sation d{'}abr{\'e}viations comme un probl{\`e}me de cat{\'e}gorisation supervis{\'e}e. Les descripteurs sont construits {\`a} partir des contextes lexical et syntaxique des abr{\'e}viations. L{'}entra{\^\i}nement est effectu{\'e} sur les phrases qui contiennent les formes {\'e}tendues des abr{\'e}viations. Le test est effectu{\'e} sur un corpus construit manuellement, o{\`u} les bons sens des abr{\'e}viations ont {\'e}t{\'e} d{\'e}finis selon les contextes. Notre approche montre une F-mesure moyenne de 0,888 sur le corpus d{'}entra{\^\i}nement en validation crois{\'e}e et 0,773 sur le corpus de test.},
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="koptient-2020-la">
<titleInfo>
<title>La désambiguisation des abréviations du domaine médical (Disambiguation of abbreviations from the medical domain)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Anaïs</namePart>
<namePart type="family">Koptient</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2020-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Benzitoun</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Chloé</namePart>
<namePart type="family">Braud</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Laurine</namePart>
<namePart type="family">Huber</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">David</namePart>
<namePart type="family">Langlois</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Slim</namePart>
<namePart type="family">Ouni</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Sylvain</namePart>
<namePart type="family">Pogodalla</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Stéphane</namePart>
<namePart type="family">Schneider</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA et AFCP</publisher>
<place>
<placeTerm type="text">Nancy, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les abréviations, tout en étant répandues dans la langue, ont une sémantique assez opaque car seulement les premières lettres sont transparentes. Cela peut donc empêcher la compréhension des abréviations, et des textes qui les contiennent, par les locuteurs. De plus, certaines abréviations sont ambiguës en ayant plusieurs sens possibles, ce qui augmente la difficulté de leur compréhension. Nous proposons de travailler avec les abréviations de la langue médicale dans un cadre lié à la simplification automatique de textes. Dans le processus de simplification, il faut en effet choisir la forme étendue des abréviations qui soit correcte pour un contexte donné. Nous proposons de traiter la désambiguïsation d’abréviations comme un problème de catégorisation supervisée. Les descripteurs sont construits à partir des contextes lexical et syntaxique des abréviations. L’entraînement est effectué sur les phrases qui contiennent les formes étendues des abréviations. Le test est effectué sur un corpus construit manuellement, où les bons sens des abréviations ont été définis selon les contextes. Notre approche montre une F-mesure moyenne de 0,888 sur le corpus d’entraînement en validation croisée et 0,773 sur le corpus de test.</abstract>
<identifier type="citekey">koptient-2020-la</identifier>
<location>
<url>https://aclanthology.org/2020.jeptalnrecital-recital.12</url>
</location>
<part>
<date>2020-6</date>
<extent unit="page">
<start>151</start>
<end>163</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T La désambiguisation des abréviations du domaine médical (Disambiguation of abbreviations from the medical domain)
%A Koptient, Anaïs
%Y Benzitoun, Christophe
%Y Braud, Chloé
%Y Huber, Laurine
%Y Langlois, David
%Y Ouni, Slim
%Y Pogodalla, Sylvain
%Y Schneider, Stéphane
%S Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL
%D 2020
%8 June
%I ATALA et AFCP
%C Nancy, France
%G French
%F koptient-2020-la
%X Les abréviations, tout en étant répandues dans la langue, ont une sémantique assez opaque car seulement les premières lettres sont transparentes. Cela peut donc empêcher la compréhension des abréviations, et des textes qui les contiennent, par les locuteurs. De plus, certaines abréviations sont ambiguës en ayant plusieurs sens possibles, ce qui augmente la difficulté de leur compréhension. Nous proposons de travailler avec les abréviations de la langue médicale dans un cadre lié à la simplification automatique de textes. Dans le processus de simplification, il faut en effet choisir la forme étendue des abréviations qui soit correcte pour un contexte donné. Nous proposons de traiter la désambiguïsation d’abréviations comme un problème de catégorisation supervisée. Les descripteurs sont construits à partir des contextes lexical et syntaxique des abréviations. L’entraînement est effectué sur les phrases qui contiennent les formes étendues des abréviations. Le test est effectué sur un corpus construit manuellement, où les bons sens des abréviations ont été définis selon les contextes. Notre approche montre une F-mesure moyenne de 0,888 sur le corpus d’entraînement en validation croisée et 0,773 sur le corpus de test.
%U https://aclanthology.org/2020.jeptalnrecital-recital.12
%P 151-163
Markdown (Informal)
[La désambiguisation des abréviations du domaine médical (Disambiguation of abbreviations from the medical domain)](https://aclanthology.org/2020.jeptalnrecital-recital.12) (Koptient, JEP/TALN/RECITAL 2020)
ACL