Les modèles multimodaux peuvent-ils aider à l’interprétation de cartes ? Une étude exploratoire avec GPT-4o

Edith Galy; Ahmed Moubtahij; Azur Handan; Marc Queudot

Les modèles multimodaux peuvent-ils aider à l’interprétation de cartes ? Une étude exploratoire avec GPT-4o

Edith Galy, Ahmed Moubtahij, Azur Handan, Marc Queudot

Abstract

Cet article explore l’utilisation des modèles de langage multimodaux, en particulier GPT-4o, pour l’interprétation automatisée de cartes de risque d’inondation. Un prototype a été développé afin de permettre à des utilisateurs non-experts de poser des questions en langage naturel et d’obtenir des réponses ancrées sur des données géospatiales visuelles. Un jeu de données ad hoc a été constitué pour évaluer la capacité du modèle à répondre à des questions fermées, selon différentes stratégies de génération. Malgré certaines améliorations grâce à l’usage de schémas de génération structurée et de raisonnements intermédiaires, les résultats révèlent une forte tendance aux hallucinations et des performances insuffisantes pour une application en contexte critique. Cette étude met en évidence les limites actuelles des modèles multimodaux pour l’analyse cartographique, et souligne la nécessité de recherches fondamentales et de corpus plus étendus pour fiabiliser ces approches.

Anthology ID:: 2025.jeptalnrecital-industrielle.4
Volume:: Actes de la session industrielle de CORIA-TALN 2025
Month:: 6
Year:: 2025
Address:: Marseille, France
Editors:: Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:: JEP/TALN/RECITAL
SIG:
Publisher:: ATALA \\& ARIA
Note:
Pages:: 48–58
Language:: French
URL:: https://aclanthology.org/2025.jeptalnrecital-industrielle.4/
DOI:
Bibkey:
Cite (ACL):: Edith Galy, Ahmed Moubtahij, Azur Handan, and Marc Queudot. 2025. Les modèles multimodaux peuvent-ils aider à l’interprétation de cartes ? Une étude exploratoire avec GPT-4o. In Actes de la session industrielle de CORIA-TALN 2025, pages 48–58, Marseille, France. ATALA \\& ARIA.
Cite (Informal):: Les modèles multimodaux peuvent-ils aider à l’interprétation de cartes ? Une étude exploratoire avec GPT-4o (Galy et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.jeptalnrecital-industrielle.4.pdf

PDF Cite Search Fix data