@inproceedings{lassalle-2011-acquisition,
title = "Acquisition automatique de terminologie {\`a} partir de corpus de texte (Automatic terminology acquisition from text corpora)",
author = "Lassalle, Edmond",
editor = "Lafourcade, Mathieu and
Prince, Violaine",
booktitle = "Actes de la 18e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2011",
address = "Montpellier, France",
publisher = "ATALA",
url = "https://aclanthology.org/2011.jeptalnrecital-long.18",
pages = "200--210",
abstract = "Les applications de recherche d{'}informations chez Orange sont confront{\'e}es {\`a} des flux importants de donn{\'e}es textuelles, recouvrant des domaines larges et {\'e}voluant tr{\`e}s rapidement. Un des probl{\`e}mes {\`a} r{\'e}soudre est de pouvoir analyser tr{\`e}s rapidement ces flux, {\`a} un niveau {\'e}lev{\'e} de qualit{\'e}. Le recours {\`a} un mod{\`e}le d{'}analyse s{\'e}mantique, comme solution, n{'}est viable qu{'}en s{'}appuyant sur l{'}apprentissage automatique pour construire des grandes bases de connaissances d{\'e}di{\'e}es {\`a} chaque application. L{'}extraction terminologique d{\'e}crite dans cet article est un composant amont de ce dispositif d{'}apprentissage. Des nouvelles m{\'e}thodes d{'}acquisition, bas{\'e}e sur un mod{\`e}le hybride (analyse par grammaires de chunking et analyse statistique {\`a} deux niveaux), ont {\'e}t{\'e} d{\'e}velopp{\'e}es pour r{\'e}pondre aux contraintes de performance et de qualit{\'e}.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="lassalle-2011-acquisition">
<titleInfo>
<title>Acquisition automatique de terminologie à partir de corpus de texte (Automatic terminology acquisition from text corpora)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Edmond</namePart>
<namePart type="family">Lassalle</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2011-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Lafourcade</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Violaine</namePart>
<namePart type="family">Prince</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Montpellier, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les applications de recherche d’informations chez Orange sont confrontées à des flux importants de données textuelles, recouvrant des domaines larges et évoluant très rapidement. Un des problèmes à résoudre est de pouvoir analyser très rapidement ces flux, à un niveau élevé de qualité. Le recours à un modèle d’analyse sémantique, comme solution, n’est viable qu’en s’appuyant sur l’apprentissage automatique pour construire des grandes bases de connaissances dédiées à chaque application. L’extraction terminologique décrite dans cet article est un composant amont de ce dispositif d’apprentissage. Des nouvelles méthodes d’acquisition, basée sur un modèle hybride (analyse par grammaires de chunking et analyse statistique à deux niveaux), ont été développées pour répondre aux contraintes de performance et de qualité.</abstract>
<identifier type="citekey">lassalle-2011-acquisition</identifier>
<location>
<url>https://aclanthology.org/2011.jeptalnrecital-long.18</url>
</location>
<part>
<date>2011-06</date>
<extent unit="page">
<start>200</start>
<end>210</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Acquisition automatique de terminologie à partir de corpus de texte (Automatic terminology acquisition from text corpora)
%A Lassalle, Edmond
%Y Lafourcade, Mathieu
%Y Prince, Violaine
%S Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2011
%8 June
%I ATALA
%C Montpellier, France
%G French
%F lassalle-2011-acquisition
%X Les applications de recherche d’informations chez Orange sont confrontées à des flux importants de données textuelles, recouvrant des domaines larges et évoluant très rapidement. Un des problèmes à résoudre est de pouvoir analyser très rapidement ces flux, à un niveau élevé de qualité. Le recours à un modèle d’analyse sémantique, comme solution, n’est viable qu’en s’appuyant sur l’apprentissage automatique pour construire des grandes bases de connaissances dédiées à chaque application. L’extraction terminologique décrite dans cet article est un composant amont de ce dispositif d’apprentissage. Des nouvelles méthodes d’acquisition, basée sur un modèle hybride (analyse par grammaires de chunking et analyse statistique à deux niveaux), ont été développées pour répondre aux contraintes de performance et de qualité.
%U https://aclanthology.org/2011.jeptalnrecital-long.18
%P 200-210
Markdown (Informal)
[Acquisition automatique de terminologie à partir de corpus de texte (Automatic terminology acquisition from text corpora)](https://aclanthology.org/2011.jeptalnrecital-long.18) (Lassalle, JEP/TALN/RECITAL 2011)
ACL