@inproceedings{silberztein-etal-2001-intex,
title = "Intex et ses applications informatiques",
author = "Silberztein, Max and
Poibeau, Thierry and
Balvet, Antonio",
editor = "Maurel, Denis",
booktitle = "Actes de la 8{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Tutoriels",
month = jul,
year = "2001",
address = "Tours, France",
publisher = "ATALA",
url = "https://aclanthology.org/2001.jeptalnrecital-tutoriel.6",
pages = "143--172",
abstract = "Intex est un environnement de d{\'e}veloppement utilis{\'e} pour construire, tester et accumuler rapidement des motifs morpho-syntaxiques qui apparaissent dans des textes {\'e}crits en langue naturelle. Un survol du syst{\`e}me est pr{\'e}sent{\'e} dans [Silberztein, 1999] , le manuel d{'}instruction est disponible [Silberztein 2000]. Chaque description {\'e}l{\'e}mentaire est repr{\'e}sent{\'e}e par une grammaire locale, qui est habituellement entr{\'e}e en machine gr{\^a}ce {\`a} l{'}{\'e}diteur de graphe d{'}Intex. Une caract{\'e}ristique importante d{'}Intex est que chaque grammaire locale peut {\^e}tre facilement r{\'e}employ{\'e}e dans d{'}autres grammaires locales. Typiquement, les d{\'e}veloppeurs construisent des graphes {\'e}l{\'e}mentaires qui sont {\'e}quivalents {\`a} des transducteurs {\`a} {\'e}tats finis, et r{\'e}emploient ces graphes dans d{'}autres graphes de plus en plus complexes. Une seconde caract{\'e}ristique d{'}Intex est que les objets trait{\'e}s (grammaires, dictionnaires et textes) sont repr{\'e}sent{\'e}s de fa{\c{c}}on interne par des transducteurs {\`a} {\'e}tats finis. En cons{\'e}quence, toutes les fonctionnalit{\'e}s du syst{\`e}me se ram{\`e}nent {\`a} un nombre limit{\'e} d{'}op{\'e}rations sur des transducteurs. Par exemple, appliquer une grammaire {\`a} un texte revient {\`a} construire l{'}union des transducteurs {\'e}l{\'e}mentaires, la d{\'e}terminiser, puis {\`a} calculer l{'}intersection du r{\'e}sultat avec le transducteur du texte. Cette architecture permet d{'}utiliser des algorithmes efficaces (par ex. lorsqu{'}on applique un transducteur d{\'e}terministe {\`a} un texte pr{\'e}alablement index{\'e}), et donne {\`a} Intex la puissance d{'}une machine de Turing (gr{\^a}ce {\`a} la possibilit{\'e} d{'}appliquer des transducteurs en cascade). Dans ce tutoriel, nous montrerons comment utiliser un outil linguistique tel qu{'}Intex dans des environnements informatiques. Nous nous appuierons sur des applications de filtrage et d{'}extraction d{'}information, r{\'e}alis{\'e}es notamment au centre de recherche de Thales. Les applications suivantes seront d{\'e}taill{\'e}es, tant sur le plan linguistique qu{'}informatique filtrage d{'}information a partir d{'}un flux AFP [Meunier et al. l999] extraction de tables d{'}interaction entre g{\`e}nes {\`a} partir de bases de donn{\'e}es textuelles en g{\'e}nomique. [Poibeau 2001] Le tutoriel montrera comment Intex peut {\^e}tre employ{\'e} comme moteur de filtrage d{'}un flux de d{\'e}p{\^e}ches de type AFP dans un cadre industriel. Il d{\'e}taillera {\'e}galement les fonctionnalit{\'e}s de transformations des textes (transduction) permettant de passer rapidement de structures linguistiques vari{\'e}es {\`a} des formes normalis{\'e}es permettant de remplir une base de donn{\'e}es. Sur le plan informatique, on d{\'e}taillera l{'}appel aux routines Intex, les param{\'e}trages possibles (d{\'e}coupage en phrases, choix des dictionnaires...), et on survolera les nouvelles possibilit{\'e}s d{'}int{\'e}gration (Intex API).",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="silberztein-etal-2001-intex">
<titleInfo>
<title>Intex et ses applications informatiques</title>
</titleInfo>
<name type="personal">
<namePart type="given">Max</namePart>
<namePart type="family">Silberztein</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Poibeau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Antonio</namePart>
<namePart type="family">Balvet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2001-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 8ème conférence sur le Traitement Automatique des Langues Naturelles. Tutoriels</title>
</titleInfo>
<name type="personal">
<namePart type="given">Denis</namePart>
<namePart type="family">Maurel</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Tours, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Intex est un environnement de développement utilisé pour construire, tester et accumuler rapidement des motifs morpho-syntaxiques qui apparaissent dans des textes écrits en langue naturelle. Un survol du système est présenté dans [Silberztein, 1999] , le manuel d’instruction est disponible [Silberztein 2000]. Chaque description élémentaire est représentée par une grammaire locale, qui est habituellement entrée en machine grâce à l’éditeur de graphe d’Intex. Une caractéristique importante d’Intex est que chaque grammaire locale peut être facilement réemployée dans d’autres grammaires locales. Typiquement, les développeurs construisent des graphes élémentaires qui sont équivalents à des transducteurs à états finis, et réemploient ces graphes dans d’autres graphes de plus en plus complexes. Une seconde caractéristique d’Intex est que les objets traités (grammaires, dictionnaires et textes) sont représentés de façon interne par des transducteurs à états finis. En conséquence, toutes les fonctionnalités du système se ramènent à un nombre limité d’opérations sur des transducteurs. Par exemple, appliquer une grammaire à un texte revient à construire l’union des transducteurs élémentaires, la déterminiser, puis à calculer l’intersection du résultat avec le transducteur du texte. Cette architecture permet d’utiliser des algorithmes efficaces (par ex. lorsqu’on applique un transducteur déterministe à un texte préalablement indexé), et donne à Intex la puissance d’une machine de Turing (grâce à la possibilité d’appliquer des transducteurs en cascade). Dans ce tutoriel, nous montrerons comment utiliser un outil linguistique tel qu’Intex dans des environnements informatiques. Nous nous appuierons sur des applications de filtrage et d’extraction d’information, réalisées notamment au centre de recherche de Thales. Les applications suivantes seront détaillées, tant sur le plan linguistique qu’informatique filtrage d’information a partir d’un flux AFP [Meunier et al. l999] extraction de tables d’interaction entre gènes à partir de bases de données textuelles en génomique. [Poibeau 2001] Le tutoriel montrera comment Intex peut être employé comme moteur de filtrage d’un flux de dépêches de type AFP dans un cadre industriel. Il détaillera également les fonctionnalités de transformations des textes (transduction) permettant de passer rapidement de structures linguistiques variées à des formes normalisées permettant de remplir une base de données. Sur le plan informatique, on détaillera l’appel aux routines Intex, les paramétrages possibles (découpage en phrases, choix des dictionnaires...), et on survolera les nouvelles possibilités d’intégration (Intex API).</abstract>
<identifier type="citekey">silberztein-etal-2001-intex</identifier>
<location>
<url>https://aclanthology.org/2001.jeptalnrecital-tutoriel.6</url>
</location>
<part>
<date>2001-07</date>
<extent unit="page">
<start>143</start>
<end>172</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Intex et ses applications informatiques
%A Silberztein, Max
%A Poibeau, Thierry
%A Balvet, Antonio
%Y Maurel, Denis
%S Actes de la 8ème conférence sur le Traitement Automatique des Langues Naturelles. Tutoriels
%D 2001
%8 July
%I ATALA
%C Tours, France
%G French
%F silberztein-etal-2001-intex
%X Intex est un environnement de développement utilisé pour construire, tester et accumuler rapidement des motifs morpho-syntaxiques qui apparaissent dans des textes écrits en langue naturelle. Un survol du système est présenté dans [Silberztein, 1999] , le manuel d’instruction est disponible [Silberztein 2000]. Chaque description élémentaire est représentée par une grammaire locale, qui est habituellement entrée en machine grâce à l’éditeur de graphe d’Intex. Une caractéristique importante d’Intex est que chaque grammaire locale peut être facilement réemployée dans d’autres grammaires locales. Typiquement, les développeurs construisent des graphes élémentaires qui sont équivalents à des transducteurs à états finis, et réemploient ces graphes dans d’autres graphes de plus en plus complexes. Une seconde caractéristique d’Intex est que les objets traités (grammaires, dictionnaires et textes) sont représentés de façon interne par des transducteurs à états finis. En conséquence, toutes les fonctionnalités du système se ramènent à un nombre limité d’opérations sur des transducteurs. Par exemple, appliquer une grammaire à un texte revient à construire l’union des transducteurs élémentaires, la déterminiser, puis à calculer l’intersection du résultat avec le transducteur du texte. Cette architecture permet d’utiliser des algorithmes efficaces (par ex. lorsqu’on applique un transducteur déterministe à un texte préalablement indexé), et donne à Intex la puissance d’une machine de Turing (grâce à la possibilité d’appliquer des transducteurs en cascade). Dans ce tutoriel, nous montrerons comment utiliser un outil linguistique tel qu’Intex dans des environnements informatiques. Nous nous appuierons sur des applications de filtrage et d’extraction d’information, réalisées notamment au centre de recherche de Thales. Les applications suivantes seront détaillées, tant sur le plan linguistique qu’informatique filtrage d’information a partir d’un flux AFP [Meunier et al. l999] extraction de tables d’interaction entre gènes à partir de bases de données textuelles en génomique. [Poibeau 2001] Le tutoriel montrera comment Intex peut être employé comme moteur de filtrage d’un flux de dépêches de type AFP dans un cadre industriel. Il détaillera également les fonctionnalités de transformations des textes (transduction) permettant de passer rapidement de structures linguistiques variées à des formes normalisées permettant de remplir une base de données. Sur le plan informatique, on détaillera l’appel aux routines Intex, les paramétrages possibles (découpage en phrases, choix des dictionnaires...), et on survolera les nouvelles possibilités d’intégration (Intex API).
%U https://aclanthology.org/2001.jeptalnrecital-tutoriel.6
%P 143-172
Markdown (Informal)
[Intex et ses applications informatiques](https://aclanthology.org/2001.jeptalnrecital-tutoriel.6) (Silberztein et al., JEP/TALN/RECITAL 2001)
ACL
- Max Silberztein, Thierry Poibeau, and Antonio Balvet. 2001. Intex et ses applications informatiques. In Actes de la 8ème conférence sur le Traitement Automatique des Langues Naturelles. Tutoriels, pages 143–172, Tours, France. ATALA.