@inproceedings{martin-2023-etudes,
title = "Etudes sur la g{\'e}olocalisation de Tweets",
author = "Martin, Thibaud",
editor = "Candito, Marie and
Gerald, Thomas and
Moreno, Jos{\'e} G",
booktitle = "Actes de CORIA-TALN 2023. Actes des 16e Rencontres Jeunes Chercheurs en RI (RJCRI) et 25e Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL)",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-rjc.8",
pages = "114--130",
abstract = {La g{\'e}olocalisation de textes non structur{\'e}s est un probl{\`e}me de recherche consistant {\`a} extraire uncontexte g{\'e}ographique d{'}un texte court. Sa r{\'e}solution passe typiquement par une recherche de termesspatiaux et de la d{\'e}sambigu{\"\i}sation. Dans cet article, nous proposons une analyse du probl{\`e}me, ainsi que deux m{\'e}thodes d{'}inf{\'e}rence pourd{\'e}terminer le lieu dont traite un texte : 1. Comparaison de termes spatiaux {\`a} un index g{\'e}ographique2. G{\'e}olocalisation de textes sans information g{\'e}ographique {\`a} partir d{'}un graphe de co-occurrencede termes (avec et sans composante temporelle) Nos recherches sont bas{\'e}es sur un dataset de 10 millions de Tweets traitant de lieux fran{\c{c}}ais, dont57 830 poss{\`e}dent une coordonn{\'e}e g{\'e}ographique.},
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="martin-2023-etudes">
<titleInfo>
<title>Etudes sur la géolocalisation de Tweets</title>
</titleInfo>
<name type="personal">
<namePart type="given">Thibaud</namePart>
<namePart type="family">Martin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes des 16e Rencontres Jeunes Chercheurs en RI (RJCRI) et 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Marie</namePart>
<namePart type="family">Candito</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thomas</namePart>
<namePart type="family">Gerald</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">José</namePart>
<namePart type="given">G</namePart>
<namePart type="family">Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La géolocalisation de textes non structurés est un problème de recherche consistant à extraire uncontexte géographique d’un texte court. Sa résolution passe typiquement par une recherche de termesspatiaux et de la désambiguïsation. Dans cet article, nous proposons une analyse du problème, ainsi que deux méthodes d’inférence pourdéterminer le lieu dont traite un texte : 1. Comparaison de termes spatiaux à un index géographique2. Géolocalisation de textes sans information géographique à partir d’un graphe de co-occurrencede termes (avec et sans composante temporelle) Nos recherches sont basées sur un dataset de 10 millions de Tweets traitant de lieux français, dont57 830 possèdent une coordonnée géographique.</abstract>
<identifier type="citekey">martin-2023-etudes</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-rjc.8</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>114</start>
<end>130</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Etudes sur la géolocalisation de Tweets
%A Martin, Thibaud
%Y Candito, Marie
%Y Gerald, Thomas
%Y Moreno, José G.
%S Actes de CORIA-TALN 2023. Actes des 16e Rencontres Jeunes Chercheurs en RI (RJCRI) et 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL)
%D 2023
%8 June
%I ATALA
%C Paris, France
%G French
%F martin-2023-etudes
%X La géolocalisation de textes non structurés est un problème de recherche consistant à extraire uncontexte géographique d’un texte court. Sa résolution passe typiquement par une recherche de termesspatiaux et de la désambiguïsation. Dans cet article, nous proposons une analyse du problème, ainsi que deux méthodes d’inférence pourdéterminer le lieu dont traite un texte : 1. Comparaison de termes spatiaux à un index géographique2. Géolocalisation de textes sans information géographique à partir d’un graphe de co-occurrencede termes (avec et sans composante temporelle) Nos recherches sont basées sur un dataset de 10 millions de Tweets traitant de lieux français, dont57 830 possèdent une coordonnée géographique.
%U https://aclanthology.org/2023.jeptalnrecital-rjc.8
%P 114-130
Markdown (Informal)
[Etudes sur la géolocalisation de Tweets](https://aclanthology.org/2023.jeptalnrecital-rjc.8) (Martin, JEP/TALN/RECITAL 2023)
ACL
- Thibaud Martin. 2023. Etudes sur la géolocalisation de Tweets. In Actes de CORIA-TALN 2023. Actes des 16e Rencontres Jeunes Chercheurs en RI (RJCRI) et 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL), pages 114–130, Paris, France. ATALA.