MOSAIC : Mélange d’experts pour la détection de textes artificiels

Matthieu Dubois, Pablo Piantanida, François Yvon


Abstract
La diffusion auprès du grand public de grands modèles de langue facilite la production de contenus nuisibles, médisants, malhonnêtes ou falsifiés. En réponse, plusieurs solutions ont été proposées pour identifier les textes ainsi produits, en traitant le problème comme une tâche de classification binaire. Les premières approches reposent sur l’analyse d’un document par un modèle détecteur, avec l’hypothèse qu’un faible score de perplexité indique que le contenu est artificiel. Des méthodes plus récentes proposent de comparer les distributions de probabilité calculées par deux modèles. Cependant, s’appuyer sur une paire fixe de modèles peut fragiliser les performances. Nous étendons ces méthodes en combinant plusieurs modèles et en développant une approche théoriquement fondée pour exploiter au mieux chacun d’entre eux.
Anthology ID:
2025.jeptalnrecital-taln.31
Volume:
Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
Month:
6
Year:
2025
Address:
Marseille, France
Editors:
Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA \\& ARIA
Note:
Pages:
502–525
Language:
French
URL:
https://aclanthology.org/2025.jeptalnrecital-taln.31/
DOI:
Bibkey:
Cite (ACL):
Matthieu Dubois, Pablo Piantanida, and François Yvon. 2025. MOSAIC : Mélange d’experts pour la détection de textes artificiels. In Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux, pages 502–525, Marseille, France. ATALA \\& ARIA.
Cite (Informal):
MOSAIC : Mélange d’experts pour la détection de textes artificiels (Dubois et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:
https://aclanthology.org/2025.jeptalnrecital-taln.31.pdf