Corpus multilingue annoté pour l’étude sémantique des expressions quantifiantes – Problèmes de segmentation du coréen et du japonais

Raoul Blin, Jinnam Choi


Abstract
Le travail présenté dans cet article s’inscrit dans le projet de constitution d’un corpus comparable, annoté pour l’étude sémantique de la quantification en coréen, français, japonais et chinois mandarin. Le corpus est annoté en dépendances au format SUD. Nous montrons la nécessité d’adopter une segmentation plus fine que celle en usage habituellement pour le coréen et le japonais. Cette segmentation améliore la description de la quantification dans environ 5% des phrases par rapport à la segmentation usuelle. Elle permet aussi une analyse morpho-syntaxique plus fine.
Anthology ID:
2025.jeptalnrecital-taln.11
Volume:
Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
Month:
6
Year:
2025
Address:
Marseille, France
Editors:
Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA \\& ARIA
Note:
Pages:
196–205
Language:
French
URL:
https://aclanthology.org/2025.jeptalnrecital-taln.11/
DOI:
Bibkey:
Cite (ACL):
Raoul Blin and Jinnam Choi. 2025. Corpus multilingue annoté pour l’étude sémantique des expressions quantifiantes – Problèmes de segmentation du coréen et du japonais. In Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux, pages 196–205, Marseille, France. ATALA \\& ARIA.
Cite (Informal):
Corpus multilingue annoté pour l’étude sémantique des expressions quantifiantes – Problèmes de segmentation du coréen et du japonais (Blin & Choi, JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:
https://aclanthology.org/2025.jeptalnrecital-taln.11.pdf