@inproceedings{kupsc-2007-extraction,
title = "Extraction automatique de cadres de sous-cat{\'e}gorisation verbale pour le fran{\c{c}}ais {\`a} partir d{'}un corpus arbor{\'e}",
author = "Kupsc, Anna",
editor = "Hathout, Nabil and
Muller, Philippe",
booktitle = "Actes de la 14{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = jun,
year = "2007",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://aclanthology.org/2007.jeptalnrecital-poster.15",
pages = "153--162",
abstract = "Nous pr{\'e}sentons une exp{\'e}rience d{'}extraction automatique des cadres de souscat{\'e}gorisation pour 1362 verbes fran{\c{c}}ais. Nous exploitons un corpus journalistique richement annot{\'e} de 15 000 phrases dont nous extrayons 12 510 occurrences verbales. Nous {\'e}valuons dans un premier temps l{'}extraction des cadres bas{\'e}e sur la fonction des arguments, ce qui nous fournit 39 cadres diff{\'e}rents avec une moyenne de 1.54 cadres par lemme. Ensuite, nous adoptons une approche mixte (fonction et cat{\'e}gorie syntaxique) qui nous fournit dans un premier temps 925 cadres diff{\'e}rents, avec une moyenne de 3.44 cadres par lemme. Plusieurs m{\'e}thodes de factorisation, neutralisant en particulier les variantes de r{\'e}alisation avec le passif ou les pronoms clitiques, sont ensuite appliqu{\'e}es et nous permettent d{'}aboutir {\`a} 235 cadres diff{\'e}rents avec une moyenne de 1.94 cadres par verbe. Nous comparons bri{\`e}vement nos r{\'e}sultats avec les travaux existants pour le fran{\c{c}}ais et pour l{'}anglais.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="kupsc-2007-extraction">
<titleInfo>
<title>Extraction automatique de cadres de sous-catégorisation verbale pour le français à partir d’un corpus arboré</title>
</titleInfo>
<name type="personal">
<namePart type="given">Anna</namePart>
<namePart type="family">Kupsc</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2007-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nabil</namePart>
<namePart type="family">Hathout</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Muller</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous présentons une expérience d’extraction automatique des cadres de souscatégorisation pour 1362 verbes français. Nous exploitons un corpus journalistique richement annoté de 15 000 phrases dont nous extrayons 12 510 occurrences verbales. Nous évaluons dans un premier temps l’extraction des cadres basée sur la fonction des arguments, ce qui nous fournit 39 cadres différents avec une moyenne de 1.54 cadres par lemme. Ensuite, nous adoptons une approche mixte (fonction et catégorie syntaxique) qui nous fournit dans un premier temps 925 cadres différents, avec une moyenne de 3.44 cadres par lemme. Plusieurs méthodes de factorisation, neutralisant en particulier les variantes de réalisation avec le passif ou les pronoms clitiques, sont ensuite appliquées et nous permettent d’aboutir à 235 cadres différents avec une moyenne de 1.94 cadres par verbe. Nous comparons brièvement nos résultats avec les travaux existants pour le français et pour l’anglais.</abstract>
<identifier type="citekey">kupsc-2007-extraction</identifier>
<location>
<url>https://aclanthology.org/2007.jeptalnrecital-poster.15</url>
</location>
<part>
<date>2007-06</date>
<extent unit="page">
<start>153</start>
<end>162</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Extraction automatique de cadres de sous-catégorisation verbale pour le français à partir d’un corpus arboré
%A Kupsc, Anna
%Y Hathout, Nabil
%Y Muller, Philippe
%S Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
%D 2007
%8 June
%I ATALA
%C Toulouse, France
%G French
%F kupsc-2007-extraction
%X Nous présentons une expérience d’extraction automatique des cadres de souscatégorisation pour 1362 verbes français. Nous exploitons un corpus journalistique richement annoté de 15 000 phrases dont nous extrayons 12 510 occurrences verbales. Nous évaluons dans un premier temps l’extraction des cadres basée sur la fonction des arguments, ce qui nous fournit 39 cadres différents avec une moyenne de 1.54 cadres par lemme. Ensuite, nous adoptons une approche mixte (fonction et catégorie syntaxique) qui nous fournit dans un premier temps 925 cadres différents, avec une moyenne de 3.44 cadres par lemme. Plusieurs méthodes de factorisation, neutralisant en particulier les variantes de réalisation avec le passif ou les pronoms clitiques, sont ensuite appliquées et nous permettent d’aboutir à 235 cadres différents avec une moyenne de 1.94 cadres par verbe. Nous comparons brièvement nos résultats avec les travaux existants pour le français et pour l’anglais.
%U https://aclanthology.org/2007.jeptalnrecital-poster.15
%P 153-162
Markdown (Informal)
[Extraction automatique de cadres de sous-catégorisation verbale pour le français à partir d’un corpus arboré](https://aclanthology.org/2007.jeptalnrecital-poster.15) (Kupsc, JEP/TALN/RECITAL 2007)
ACL