@inproceedings{guembour-2024-analyse,
title = "Analyse s{\'e}mantique du corpus des Cahiers citoyens",
author = "Guembour, Sami",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 26{\`e}me Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-recital.2",
pages = "17--27",
abstract = "Cet article pr{\'e}sente une recherche originale qui se concentre sur une analyse s{\'e}mantique du corpus des Cahiers citoyens, qui regroupe les contributions et les dol{\'e}ances des citoyens fran{\c{c}}ais d{\'e}pos{\'e}es au niveau des mairies dans le cadre du Grand D{\'e}bat National. L{'}article offre un {\'e}tat de l{'}art complet sur les divers travaux r{\'e}alis{\'e}s sur ce corpus et vise {\`a} obtenir une compr{\'e}hension approfondie des th{\`e}mes {\'e}mergents et des pr{\'e}occupations citoyennes dans les diff{\'e}rentes r{\'e}gions. Plusieurs hypoth{\`e}ses concernant ces travaux ont {\'e}t{\'e} {\'e}mises, et diff{\'e}rentes m{\'e}thodes ont {\'e}t{\'e} propos{\'e}es pour r{\'e}pondre {\`a} ces hypoth{\`e}ses, de la segmentation et du pr{\'e}-traitement du corpus au calcul des vecteurs de plongement des phrases {\`a} l{'}aide de mod{\`e}les de langues pr{\'e}-entra{\^\i}n{\'e}s, aboutissant au clustering de ces vecteurs pour construire des regroupements en fonction des probl{\'e}matiques abord{\'e}es.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="guembour-2024-analyse">
<titleInfo>
<title>Analyse sémantique du corpus des Cahiers citoyens</title>
</titleInfo>
<name type="personal">
<namePart type="given">Sami</namePart>
<namePart type="family">Guembour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article présente une recherche originale qui se concentre sur une analyse sémantique du corpus des Cahiers citoyens, qui regroupe les contributions et les doléances des citoyens français déposées au niveau des mairies dans le cadre du Grand Débat National. L’article offre un état de l’art complet sur les divers travaux réalisés sur ce corpus et vise à obtenir une compréhension approfondie des thèmes émergents et des préoccupations citoyennes dans les différentes régions. Plusieurs hypothèses concernant ces travaux ont été émises, et différentes méthodes ont été proposées pour répondre à ces hypothèses, de la segmentation et du pré-traitement du corpus au calcul des vecteurs de plongement des phrases à l’aide de modèles de langues pré-entraînés, aboutissant au clustering de ces vecteurs pour construire des regroupements en fonction des problématiques abordées.</abstract>
<identifier type="citekey">guembour-2024-analyse</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-recital.2</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>17</start>
<end>27</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Analyse sémantique du corpus des Cahiers citoyens
%A Guembour, Sami
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes de la 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G French
%F guembour-2024-analyse
%X Cet article présente une recherche originale qui se concentre sur une analyse sémantique du corpus des Cahiers citoyens, qui regroupe les contributions et les doléances des citoyens français déposées au niveau des mairies dans le cadre du Grand Débat National. L’article offre un état de l’art complet sur les divers travaux réalisés sur ce corpus et vise à obtenir une compréhension approfondie des thèmes émergents et des préoccupations citoyennes dans les différentes régions. Plusieurs hypothèses concernant ces travaux ont été émises, et différentes méthodes ont été proposées pour répondre à ces hypothèses, de la segmentation et du pré-traitement du corpus au calcul des vecteurs de plongement des phrases à l’aide de modèles de langues pré-entraînés, aboutissant au clustering de ces vecteurs pour construire des regroupements en fonction des problématiques abordées.
%U https://aclanthology.org/2024.jeptalnrecital-recital.2
%P 17-27
Markdown (Informal)
[Analyse sémantique du corpus des Cahiers citoyens](https://aclanthology.org/2024.jeptalnrecital-recital.2) (Guembour, JEP/TALN/RECITAL 2024)
ACL