@inproceedings{even-enguehard-2002-extraction,
title = "Extraction d{'}informations {\`a} partir de corpus d{\'e}grad{\'e}s",
author = "Even, Fabrice and
Enguehard, Chantal",
editor = "Pierrel, Jean-Marie",
booktitle = "Actes de la 9{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2002",
address = "Nancy, France",
publisher = "ATALA",
url = "https://aclanthology.org/2002.jeptalnrecital-long.8",
pages = "105--115",
abstract = "Nous pr{\'e}sentons une m{\'e}thode automatique d{'}extraction d{'}information {\`a} partir d{'}un corpus mono-domaine de mauvaise qualit{\'e}, sur lequel il est impossible d{'}appliquer les m{\'e}thodes classiques de traitement de la langue naturelle. Cette approche se fonde sur la construction d{'}une ontologie semi-formelle (mod{\'e}lisant les informations contenues dans le corpus et les relations entre elles). Notre m{\'e}thode se d{\'e}roule en trois phases : 1) la normalisation du corpus, 2) la construction de l{'}ontologie, et 3) sa formalisation sous la forme d{'}une grammaire. L{'}extraction d{'}information {\`a} proprement parler exploite un {\'e}tiquetage utilisant les r{\`e}gles d{\'e}finies par la grammaire. Nous illustrons notre d{\'e}marche d{'}une application sur un corpus bancaire.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="even-enguehard-2002-extraction">
<titleInfo>
<title>Extraction d’informations à partir de corpus dégradés</title>
</titleInfo>
<name type="personal">
<namePart type="given">Fabrice</namePart>
<namePart type="family">Even</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Chantal</namePart>
<namePart type="family">Enguehard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2002-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jean-Marie</namePart>
<namePart type="family">Pierrel</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Nancy, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous présentons une méthode automatique d’extraction d’information à partir d’un corpus mono-domaine de mauvaise qualité, sur lequel il est impossible d’appliquer les méthodes classiques de traitement de la langue naturelle. Cette approche se fonde sur la construction d’une ontologie semi-formelle (modélisant les informations contenues dans le corpus et les relations entre elles). Notre méthode se déroule en trois phases : 1) la normalisation du corpus, 2) la construction de l’ontologie, et 3) sa formalisation sous la forme d’une grammaire. L’extraction d’information à proprement parler exploite un étiquetage utilisant les règles définies par la grammaire. Nous illustrons notre démarche d’une application sur un corpus bancaire.</abstract>
<identifier type="citekey">even-enguehard-2002-extraction</identifier>
<location>
<url>https://aclanthology.org/2002.jeptalnrecital-long.8</url>
</location>
<part>
<date>2002-06</date>
<extent unit="page">
<start>105</start>
<end>115</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Extraction d’informations à partir de corpus dégradés
%A Even, Fabrice
%A Enguehard, Chantal
%Y Pierrel, Jean-Marie
%S Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2002
%8 June
%I ATALA
%C Nancy, France
%G French
%F even-enguehard-2002-extraction
%X Nous présentons une méthode automatique d’extraction d’information à partir d’un corpus mono-domaine de mauvaise qualité, sur lequel il est impossible d’appliquer les méthodes classiques de traitement de la langue naturelle. Cette approche se fonde sur la construction d’une ontologie semi-formelle (modélisant les informations contenues dans le corpus et les relations entre elles). Notre méthode se déroule en trois phases : 1) la normalisation du corpus, 2) la construction de l’ontologie, et 3) sa formalisation sous la forme d’une grammaire. L’extraction d’information à proprement parler exploite un étiquetage utilisant les règles définies par la grammaire. Nous illustrons notre démarche d’une application sur un corpus bancaire.
%U https://aclanthology.org/2002.jeptalnrecital-long.8
%P 105-115
Markdown (Informal)
[Extraction d’informations à partir de corpus dégradés](https://aclanthology.org/2002.jeptalnrecital-long.8) (Even & Enguehard, JEP/TALN/RECITAL 2002)
ACL