Les modèles de langue contextuels Camembert pour le français : impact de la taille et de l’hétérogénéité des données d’entrainement (C AMEM BERT Contextual Language Models for French: Impact of Training Data Size and Heterogeneity ) Louis Martin author Benjamin Muller author Pedro Javier Ortiz Suárez author Yoann Dupont author Laurent Romary author Éric Villemonte de la Clergerie author Benoît Sagot author Djamé Seddah author 2020-06 text fra Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles Christophe Benzitoun editor Chloé Braud editor Laurine Huber editor David Langlois editor Slim Ouni editor Sylvain Pogodalla editor Stéphane Schneider editor ATALA et AFCP Nancy, France conference publication martin-etal-2020-les https://aclanthology.org/2020.jeptalnrecital-taln.5/ 2020-6 54 65