@inproceedings{plantevit-charnois-2009-motifs,
title = "Motifs s{\'e}quentiels pour l{'}extraction d{'}information : illustration sur le probl{\`e}me de la d{\'e}tection d{'}interactions entre g{\`e}nes",
author = "Plantevit, Marc and
Charnois, Thierry",
editor = "Nazarenko, Adeline and
Poibeau, Thierry",
booktitle = "Actes de la 16{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2009",
address = "Senlis, France",
publisher = "ATALA",
url = "https://aclanthology.org/2009.jeptalnrecital-long.15",
pages = "141--150",
abstract = "Face {\`a} la prolif{\'e}ration des publications en biologie et m{\'e}decine (plus de 18 millions de publications actuellement recens{\'e}es dans PubMed), l{'}extraction d{'}information automatique est devenue un enjeu crucial. Il existe de nombreux travaux dans le domaine du traitement de la langue appliqu{\'e}e {\`a} la biom{\'e}decine ({``}BioNLP{''}). Ces travaux se distribuent en deux grandes tendances. La premi{\`e}re est fond{\'e}e sur les m{\'e}thodes d{'}apprentissage automatique de type num{\'e}rique qui donnent de bons r{\'e}sultats mais ont un fonctionnement de type {``}boite noire{''}. La deuxi{\`e}me tendance est celle du TALN {\`a} base d{'}analyses (lexicales, syntaxiques, voire s{\'e}mantiques ou discursives) co{\^u}teuses en temps de d{\'e}veloppement des ressources n{\'e}cessaires (lexiques, grammaires, etc.). Nous proposons dans cet article une approche bas{\'e}e sur la d{\'e}couverte de motifs s{\'e}quentiels pour apprendre automatiquement les ressources linguistiques, en l{'}occurrence les patrons linguistiques qui permettent l{'}extraction de l{'}information dans les textes. Plusieurs aspects m{\'e}ritent d{'}{\^e}tre soulign{\'e}s : cette approche permet de s{'}affranchir de l{'}analyse syntaxique de la phrase, elle ne n{\'e}cessite pas de ressources en dehors du corpus d{'}apprentissage et elle ne demande que tr{\`e}s peu d{'}intervention manuelle. Nous illustrons l{'}approche sur le probl{\`e}me de la d{\'e}tection d{'}interactions entre g{\`e}nes et donnons les r{\'e}sultats obtenus sur des corpus biologiques qui montrent l{'}int{\'e}r{\^e}t de ce type d{'}approche.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="plantevit-charnois-2009-motifs">
<titleInfo>
<title>Motifs séquentiels pour l’extraction d’information : illustration sur le problème de la détection d’interactions entre gènes</title>
</titleInfo>
<name type="personal">
<namePart type="given">Marc</namePart>
<namePart type="family">Plantevit</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Charnois</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2009-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Nazarenko</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Poibeau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Senlis, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Face à la prolifération des publications en biologie et médecine (plus de 18 millions de publications actuellement recensées dans PubMed), l’extraction d’information automatique est devenue un enjeu crucial. Il existe de nombreux travaux dans le domaine du traitement de la langue appliquée à la biomédecine (“BioNLP”). Ces travaux se distribuent en deux grandes tendances. La première est fondée sur les méthodes d’apprentissage automatique de type numérique qui donnent de bons résultats mais ont un fonctionnement de type “boite noire”. La deuxième tendance est celle du TALN à base d’analyses (lexicales, syntaxiques, voire sémantiques ou discursives) coûteuses en temps de développement des ressources nécessaires (lexiques, grammaires, etc.). Nous proposons dans cet article une approche basée sur la découverte de motifs séquentiels pour apprendre automatiquement les ressources linguistiques, en l’occurrence les patrons linguistiques qui permettent l’extraction de l’information dans les textes. Plusieurs aspects méritent d’être soulignés : cette approche permet de s’affranchir de l’analyse syntaxique de la phrase, elle ne nécessite pas de ressources en dehors du corpus d’apprentissage et elle ne demande que très peu d’intervention manuelle. Nous illustrons l’approche sur le problème de la détection d’interactions entre gènes et donnons les résultats obtenus sur des corpus biologiques qui montrent l’intérêt de ce type d’approche.</abstract>
<identifier type="citekey">plantevit-charnois-2009-motifs</identifier>
<location>
<url>https://aclanthology.org/2009.jeptalnrecital-long.15</url>
</location>
<part>
<date>2009-06</date>
<extent unit="page">
<start>141</start>
<end>150</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Motifs séquentiels pour l’extraction d’information : illustration sur le problème de la détection d’interactions entre gènes
%A Plantevit, Marc
%A Charnois, Thierry
%Y Nazarenko, Adeline
%Y Poibeau, Thierry
%S Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2009
%8 June
%I ATALA
%C Senlis, France
%G French
%F plantevit-charnois-2009-motifs
%X Face à la prolifération des publications en biologie et médecine (plus de 18 millions de publications actuellement recensées dans PubMed), l’extraction d’information automatique est devenue un enjeu crucial. Il existe de nombreux travaux dans le domaine du traitement de la langue appliquée à la biomédecine (“BioNLP”). Ces travaux se distribuent en deux grandes tendances. La première est fondée sur les méthodes d’apprentissage automatique de type numérique qui donnent de bons résultats mais ont un fonctionnement de type “boite noire”. La deuxième tendance est celle du TALN à base d’analyses (lexicales, syntaxiques, voire sémantiques ou discursives) coûteuses en temps de développement des ressources nécessaires (lexiques, grammaires, etc.). Nous proposons dans cet article une approche basée sur la découverte de motifs séquentiels pour apprendre automatiquement les ressources linguistiques, en l’occurrence les patrons linguistiques qui permettent l’extraction de l’information dans les textes. Plusieurs aspects méritent d’être soulignés : cette approche permet de s’affranchir de l’analyse syntaxique de la phrase, elle ne nécessite pas de ressources en dehors du corpus d’apprentissage et elle ne demande que très peu d’intervention manuelle. Nous illustrons l’approche sur le problème de la détection d’interactions entre gènes et donnons les résultats obtenus sur des corpus biologiques qui montrent l’intérêt de ce type d’approche.
%U https://aclanthology.org/2009.jeptalnrecital-long.15
%P 141-150
Markdown (Informal)
[Motifs séquentiels pour l’extraction d’information : illustration sur le problème de la détection d’interactions entre gènes](https://aclanthology.org/2009.jeptalnrecital-long.15) (Plantevit & Charnois, JEP/TALN/RECITAL 2009)
ACL