SuperGPQA-HCE-FR : un corpus spécialisé en français pour le domaine hydraulique et le génie civil

Markarit Vartampetian, Diandra Fabre, Philippe Mulhem, Sylvain Joubert, Didier Schwab


Abstract
Dans cet article, nous présentons SuperGPQA-HCE-FR, une adaptation française d’un sous-ensemble du benchmark SuperGPQA axé sur les domaines de l’ingénierie hydraulique et du génie civil. Il comprend 285 questions à choix multiples conçues pour évaluer et spécialiser des modèles de langue multilingues de grande taille (LLMs) sur des tâches techniques. La traduction réalisée automatiquement est ensuite évaluée par des experts des domaines. Enfin, nous présentons les premiers résultats sur des modèles Instruct généralistes multilingues en comparant les performances du corpus original en anglais à celles du corpus traduit en français.
Anthology ID:
2025.jeptalnrecital-evalllm.20
Volume:
Actes de l'atelier Évaluation des modèles génératifs (LLM) et challenge 2025 (EvalLLM)
Month:
6
Year:
2025
Address:
Marseille, France
Editors:
Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA \\& ARIA
Note:
Pages:
253–276
Language:
French
URL:
https://aclanthology.org/2025.jeptalnrecital-evalllm.20/
DOI:
Bibkey:
Cite (ACL):
Markarit Vartampetian, Diandra Fabre, Philippe Mulhem, Sylvain Joubert, and Didier Schwab. 2025. SuperGPQA-HCE-FR : un corpus spécialisé en français pour le domaine hydraulique et le génie civil. In Actes de l'atelier Évaluation des modèles génératifs (LLM) et challenge 2025 (EvalLLM), pages 253–276, Marseille, France. ATALA \\& ARIA.
Cite (Informal):
SuperGPQA-HCE-FR : un corpus spécialisé en français pour le domaine hydraulique et le génie civil (Vartampetian et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:
https://aclanthology.org/2025.jeptalnrecital-evalllm.20.pdf