@inproceedings{galy-etal-2025-les,
title = "Les mod{\`e}les multimodaux peuvent-ils aider {\`a} l{'}interpr{\'e}tation de cartes ? Une {\'e}tude exploratoire avec {GPT}-4o",
author = "Galy, Edith and
Moubtahij, Ahmed and
Handan, Azur and
Queudot, Marc",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de la session industrielle de CORIA-TALN 2025",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-industrielle.4/",
pages = "48--58",
language = "fra",
abstract = "Cet article explore l{'}utilisation des mod{\`e}les de langage multimodaux, en particulier GPT-4o, pour l{'}interpr{\'e}tation automatis{\'e}e de cartes de risque d{'}inondation. Un prototype a {\'e}t{\'e} d{\'e}velopp{\'e} afin de permettre {\`a} des utilisateurs non-experts de poser des questions en langage naturel et d{'}obtenir des r{\'e}ponses ancr{\'e}es sur des donn{\'e}es g{\'e}ospatiales visuelles. Un jeu de donn{\'e}es ad hoc a {\'e}t{\'e} constitu{\'e} pour {\'e}valuer la capacit{\'e} du mod{\`e}le {\`a} r{\'e}pondre {\`a} des questions ferm{\'e}es, selon diff{\'e}rentes strat{\'e}gies de g{\'e}n{\'e}ration. Malgr{\'e} certaines am{\'e}liorations gr{\^a}ce {\`a} l{'}usage de sch{\'e}mas de g{\'e}n{\'e}ration structur{\'e}e et de raisonnements interm{\'e}diaires, les r{\'e}sultats r{\'e}v{\`e}lent une forte tendance aux hallucinations et des performances insuffisantes pour une application en contexte critique. Cette {\'e}tude met en {\'e}vidence les limites actuelles des mod{\`e}les multimodaux pour l{'}analyse cartographique, et souligne la n{\'e}cessit{\'e} de recherches fondamentales et de corpus plus {\'e}tendus pour fiabiliser ces approches."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="galy-etal-2025-les">
<titleInfo>
<title>Les modèles multimodaux peuvent-ils aider à l’interprétation de cartes ? Une étude exploratoire avec GPT-4o</title>
</titleInfo>
<name type="personal">
<namePart type="given">Edith</namePart>
<namePart type="family">Galy</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Ahmed</namePart>
<namePart type="family">Moubtahij</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Azur</namePart>
<namePart type="family">Handan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marc</namePart>
<namePart type="family">Queudot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la session industrielle de CORIA-TALN 2025</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article explore l’utilisation des modèles de langage multimodaux, en particulier GPT-4o, pour l’interprétation automatisée de cartes de risque d’inondation. Un prototype a été développé afin de permettre à des utilisateurs non-experts de poser des questions en langage naturel et d’obtenir des réponses ancrées sur des données géospatiales visuelles. Un jeu de données ad hoc a été constitué pour évaluer la capacité du modèle à répondre à des questions fermées, selon différentes stratégies de génération. Malgré certaines améliorations grâce à l’usage de schémas de génération structurée et de raisonnements intermédiaires, les résultats révèlent une forte tendance aux hallucinations et des performances insuffisantes pour une application en contexte critique. Cette étude met en évidence les limites actuelles des modèles multimodaux pour l’analyse cartographique, et souligne la nécessité de recherches fondamentales et de corpus plus étendus pour fiabiliser ces approches.</abstract>
<identifier type="citekey">galy-etal-2025-les</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-industrielle.4/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>48</start>
<end>58</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Les modèles multimodaux peuvent-ils aider à l’interprétation de cartes ? Une étude exploratoire avec GPT-4o
%A Galy, Edith
%A Moubtahij, Ahmed
%A Handan, Azur
%A Queudot, Marc
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes de la session industrielle de CORIA-TALN 2025
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F galy-etal-2025-les
%X Cet article explore l’utilisation des modèles de langage multimodaux, en particulier GPT-4o, pour l’interprétation automatisée de cartes de risque d’inondation. Un prototype a été développé afin de permettre à des utilisateurs non-experts de poser des questions en langage naturel et d’obtenir des réponses ancrées sur des données géospatiales visuelles. Un jeu de données ad hoc a été constitué pour évaluer la capacité du modèle à répondre à des questions fermées, selon différentes stratégies de génération. Malgré certaines améliorations grâce à l’usage de schémas de génération structurée et de raisonnements intermédiaires, les résultats révèlent une forte tendance aux hallucinations et des performances insuffisantes pour une application en contexte critique. Cette étude met en évidence les limites actuelles des modèles multimodaux pour l’analyse cartographique, et souligne la nécessité de recherches fondamentales et de corpus plus étendus pour fiabiliser ces approches.
%U https://aclanthology.org/2025.jeptalnrecital-industrielle.4/
%P 48-58
Markdown (Informal)
[Les modèles multimodaux peuvent-ils aider à l’interprétation de cartes ? Une étude exploratoire avec GPT-4o](https://aclanthology.org/2025.jeptalnrecital-industrielle.4/) (Galy et al., JEP/TALN/RECITAL 2025)
ACL