@inproceedings{hamon-etal-2007-ogmios,
title = "{OGMIOS} : une plate-forme d{'}annotation linguistique de collection de documents issus du Web",
author = "Hamon, Thierry and
Derivi{\`e}re, Julien and
Nazarenko, Adeline",
editor = "Hathout, Nabil and
Muller, Philippe",
booktitle = "Actes de la 14{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = jun,
year = "2007",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://aclanthology.org/2007.jeptalnrecital-poster.10",
pages = "103--112",
abstract = "L{'}un des objectifs du projet ALVIS est d{'}int{\'e}grer des informations linguistiques dans des moteurs de recherche sp{\'e}cialis{\'e}s. Dans ce contexte, nous avons con{\c{c}}u une plate-forme d{'}enrichissement linguistique de documents issus du Web, OGMIOS, exploitant des outils de TAL existants. Les documents peuvent {\^e}tre en fran{\c{c}}ais ou en anglais. Cette architecture est distribu{\'e}e, afin de r{\'e}pondre aux contraintes li{\'e}es aux traitements de gros volumes de textes, et adaptable, pour permettre l{'}analyse de sous-langages. La plate-forme est d{\'e}velopp{\'e}e en Perl et disponible sous forme de modules CPAN. C{'}est une structure modulaire dans lequel il est possible d{'}int{\'e}grer de nouvelles ressources ou de nouveaux outils de TAL. On peut ainsi d{\'e}finir des configuration diff{\'e}rentes pour diff{\'e}rents domaines et types de collections. Cette plateforme robuste permet d{'}analyser en masse des donn{\'e}es issus du web qui sont par essence tr{\`e}s h{\'e}t{\'e}rog{\`e}nes. Nous avons {\'e}valu{\'e} les performances de la plateforme sur plusieurs collections de documents. En distribuant les traitements sur vingt machines, une collection de 55 329 documents du domaine de la biologie (106 millions de mots) a {\'e}t{\'e} annot{\'e}e en 35 heures tandis qu{'}une collection de 48 422 d{\'e}p{\^e}ches relatives aux moteurs de recherche (14 millions de mots) a {\'e}t{\'e} annot{\'e}e en 3 heures et 15 minutes.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="hamon-etal-2007-ogmios">
<titleInfo>
<title>OGMIOS : une plate-forme d’annotation linguistique de collection de documents issus du Web</title>
</titleInfo>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Hamon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Derivière</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Nazarenko</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2007-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nabil</namePart>
<namePart type="family">Hathout</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Muller</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’un des objectifs du projet ALVIS est d’intégrer des informations linguistiques dans des moteurs de recherche spécialisés. Dans ce contexte, nous avons conçu une plate-forme d’enrichissement linguistique de documents issus du Web, OGMIOS, exploitant des outils de TAL existants. Les documents peuvent être en français ou en anglais. Cette architecture est distribuée, afin de répondre aux contraintes liées aux traitements de gros volumes de textes, et adaptable, pour permettre l’analyse de sous-langages. La plate-forme est développée en Perl et disponible sous forme de modules CPAN. C’est une structure modulaire dans lequel il est possible d’intégrer de nouvelles ressources ou de nouveaux outils de TAL. On peut ainsi définir des configuration différentes pour différents domaines et types de collections. Cette plateforme robuste permet d’analyser en masse des données issus du web qui sont par essence très hétérogènes. Nous avons évalué les performances de la plateforme sur plusieurs collections de documents. En distribuant les traitements sur vingt machines, une collection de 55 329 documents du domaine de la biologie (106 millions de mots) a été annotée en 35 heures tandis qu’une collection de 48 422 dépêches relatives aux moteurs de recherche (14 millions de mots) a été annotée en 3 heures et 15 minutes.</abstract>
<identifier type="citekey">hamon-etal-2007-ogmios</identifier>
<location>
<url>https://aclanthology.org/2007.jeptalnrecital-poster.10</url>
</location>
<part>
<date>2007-06</date>
<extent unit="page">
<start>103</start>
<end>112</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T OGMIOS : une plate-forme d’annotation linguistique de collection de documents issus du Web
%A Hamon, Thierry
%A Derivière, Julien
%A Nazarenko, Adeline
%Y Hathout, Nabil
%Y Muller, Philippe
%S Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
%D 2007
%8 June
%I ATALA
%C Toulouse, France
%G French
%F hamon-etal-2007-ogmios
%X L’un des objectifs du projet ALVIS est d’intégrer des informations linguistiques dans des moteurs de recherche spécialisés. Dans ce contexte, nous avons conçu une plate-forme d’enrichissement linguistique de documents issus du Web, OGMIOS, exploitant des outils de TAL existants. Les documents peuvent être en français ou en anglais. Cette architecture est distribuée, afin de répondre aux contraintes liées aux traitements de gros volumes de textes, et adaptable, pour permettre l’analyse de sous-langages. La plate-forme est développée en Perl et disponible sous forme de modules CPAN. C’est une structure modulaire dans lequel il est possible d’intégrer de nouvelles ressources ou de nouveaux outils de TAL. On peut ainsi définir des configuration différentes pour différents domaines et types de collections. Cette plateforme robuste permet d’analyser en masse des données issus du web qui sont par essence très hétérogènes. Nous avons évalué les performances de la plateforme sur plusieurs collections de documents. En distribuant les traitements sur vingt machines, une collection de 55 329 documents du domaine de la biologie (106 millions de mots) a été annotée en 35 heures tandis qu’une collection de 48 422 dépêches relatives aux moteurs de recherche (14 millions de mots) a été annotée en 3 heures et 15 minutes.
%U https://aclanthology.org/2007.jeptalnrecital-poster.10
%P 103-112
Markdown (Informal)
[OGMIOS : une plate-forme d’annotation linguistique de collection de documents issus du Web](https://aclanthology.org/2007.jeptalnrecital-poster.10) (Hamon et al., JEP/TALN/RECITAL 2007)
ACL