Régression logistique parcimonieuse pour l’extraction automatique de règles de grammaire

Santiago Herrera, Caio Corro, Sylvain Kahane


Abstract
Nous proposons une nouvelle approche pour extraire et explorer des motifs grammaticaux à partir de corpus arborés, dans le but de construire des règles de grammaire syntaxique. Plus précisément, nous nous intéressons à deux phénomènes linguistiques, l’accord et l’ordre des mots, en utilisant un espace de recherche étendu et en accordant une attention particulière au classement des règles. Pour cela, nous utilisons un classifieur linéaire entraîné avec une pénalisation L1 pour identifier les caractéristiques les plus saillantes. Nous associons ensuite des informations quantitatives à chaque règle. Notre méthode permet de découvrir des règles de différentes granularités, certaines connues et d’autres moins. Dans ce travail, nous nous intéressons aux règles issues d’un corpus du français.
Anthology ID:
2024.jeptalnrecital-taln.14
Volume:
Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position
Month:
7
Year:
2024
Address:
Toulouse, France
Editors:
Mathieu Balaguer, Nihed Bendahman, Lydia-Mai Ho-dac, Julie Mauclair, Jose G Moreno, Julien Pinquier
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA and AFPC
Note:
Pages:
211–218
Language:
French
URL:
https://aclanthology.org/2024.jeptalnrecital-taln.14
DOI:
Bibkey:
Cite (ACL):
Santiago Herrera, Caio Corro, and Sylvain Kahane. 2024. Régression logistique parcimonieuse pour l’extraction automatique de règles de grammaire. In Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position, pages 211–218, Toulouse, France. ATALA and AFPC.
Cite (Informal):
Régression logistique parcimonieuse pour l’extraction automatique de règles de grammaire (Herrera et al., JEP/TALN/RECITAL 2024)
Copy Citation:
PDF:
https://aclanthology.org/2024.jeptalnrecital-taln.14.pdf