@inproceedings{blanc-etal-2007-segmentation,
title = "Segmentation en super-chunks",
author = "Blanc, Olivier and
Constant, Matthieu and
Watrin, Patrick",
editor = "Hathout, Nabil and
Muller, Philippe",
booktitle = "Actes de la 14{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = jun,
year = "2007",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://aclanthology.org/2007.jeptalnrecital-poster.3/",
pages = "33--42",
language = "fra",
abstract = {Depuis l`analyseur d{\'e}velopp{\'e} par Harris {\`a} la fin des ann{\'e}es 50, les unit{\'e}s polylexicales ont peu {\`a} peu {\'e}t{\'e} int{\'e}gr{\'e}es aux analyseurs syntaxiques. Cependant, pour la plupart, elles sont encore restreintes aux mots compos{\'e}s qui sont plus stables et moins nombreux. Toutefois, la langue est remplie d`expressions semi-fig{\'e}es qui forment {\'e}galement des unit{\'e}s s{\'e}mantiques : les expressions adverbiales et les collocations. De m{\^e}me que pour les mots compos{\'e}s traditionnels, l`identification de ces structures limite la complexit{\'e} combinatoire induite par l`ambigu{\"i}t{\'e} lexicale. Dans cet article, nous d{\'e}taillons une exp{\'e}rience qui int{\`e}gre ces notions dans un processus de segmentation en super-chunks, pr{\'e}alable {\`a} l`analyse syntaxique. Nous montrons que notre chunker, d{\'e}velopp{\'e} pour le fran{\c{c}}ais, atteint une pr{\'e}cision et un rappel de 92,9 {\%} et 98,7 {\%}, respectivement. Par ailleurs, les unit{\'e}s polylexicales r{\'e}alisent 36,6 {\%} des attachements internes aux constituants nominaux et pr{\'e}positionnels.}
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="blanc-etal-2007-segmentation">
<titleInfo>
<title>Segmentation en super-chunks</title>
</titleInfo>
<name type="personal">
<namePart type="given">Olivier</namePart>
<namePart type="family">Blanc</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Matthieu</namePart>
<namePart type="family">Constant</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Patrick</namePart>
<namePart type="family">Watrin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2007-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nabil</namePart>
<namePart type="family">Hathout</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Muller</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Depuis l‘analyseur développé par Harris à la fin des années 50, les unités polylexicales ont peu à peu été intégrées aux analyseurs syntaxiques. Cependant, pour la plupart, elles sont encore restreintes aux mots composés qui sont plus stables et moins nombreux. Toutefois, la langue est remplie d‘expressions semi-figées qui forment également des unités sémantiques : les expressions adverbiales et les collocations. De même que pour les mots composés traditionnels, l‘identification de ces structures limite la complexité combinatoire induite par l‘ambiguïté lexicale. Dans cet article, nous détaillons une expérience qui intègre ces notions dans un processus de segmentation en super-chunks, préalable à l‘analyse syntaxique. Nous montrons que notre chunker, développé pour le français, atteint une précision et un rappel de 92,9 % et 98,7 %, respectivement. Par ailleurs, les unités polylexicales réalisent 36,6 % des attachements internes aux constituants nominaux et prépositionnels.</abstract>
<identifier type="citekey">blanc-etal-2007-segmentation</identifier>
<location>
<url>https://aclanthology.org/2007.jeptalnrecital-poster.3/</url>
</location>
<part>
<date>2007-06</date>
<extent unit="page">
<start>33</start>
<end>42</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Segmentation en super-chunks
%A Blanc, Olivier
%A Constant, Matthieu
%A Watrin, Patrick
%Y Hathout, Nabil
%Y Muller, Philippe
%S Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
%D 2007
%8 June
%I ATALA
%C Toulouse, France
%G fra
%F blanc-etal-2007-segmentation
%X Depuis l‘analyseur développé par Harris à la fin des années 50, les unités polylexicales ont peu à peu été intégrées aux analyseurs syntaxiques. Cependant, pour la plupart, elles sont encore restreintes aux mots composés qui sont plus stables et moins nombreux. Toutefois, la langue est remplie d‘expressions semi-figées qui forment également des unités sémantiques : les expressions adverbiales et les collocations. De même que pour les mots composés traditionnels, l‘identification de ces structures limite la complexité combinatoire induite par l‘ambiguïté lexicale. Dans cet article, nous détaillons une expérience qui intègre ces notions dans un processus de segmentation en super-chunks, préalable à l‘analyse syntaxique. Nous montrons que notre chunker, développé pour le français, atteint une précision et un rappel de 92,9 % et 98,7 %, respectivement. Par ailleurs, les unités polylexicales réalisent 36,6 % des attachements internes aux constituants nominaux et prépositionnels.
%U https://aclanthology.org/2007.jeptalnrecital-poster.3/
%P 33-42
Markdown (Informal)
[Segmentation en super-chunks](https://aclanthology.org/2007.jeptalnrecital-poster.3/) (Blanc et al., JEP/TALN/RECITAL 2007)
ACL
- Olivier Blanc, Matthieu Constant, and Patrick Watrin. 2007. Segmentation en super-chunks. In Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters, pages 33–42, Toulouse, France. ATALA.