@inproceedings{louradour-etal-2024-claire,
title = "{C}laire: Large Language Models for Spontaneous {F}rench Dialogue",
author = {Louradour, J{\'e}r{\^o}me and
Hunter, Julie and
Harrando, Isma{\"\i}l and
Shang, Guokan and
Rennard, Virgile and
Lorr{\'e}, Jean-Pierre},
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-taln.36",
pages = "530--548",
abstract = "Nous pr{\'e}sentons la famille de mod{\`e}les Claire, une collection de mod{\`e}les de langage con{\c{c}}us pour am{\'e}liorer les t{\^a}ches n{\'e}cessitant la compr{\'e}hension des conversations parl{\'e}es, tel que le r{\'e}sum{\'e} de r{\'e}unions. Nos mod{\`e}les r{\'e}sultent de la poursuite du pr{\'e}-entra{\^\i}nement de deux mod{\`e}les de base exclusivement sur des transcriptions de conversations et des pi{\`e}ces de th{\'e}{\^a}tre. Aussi nous nous concentrons sur les donn{\'e}es en fran{\c{c}}ais afin de contrebalancer l{'}accent mis sur l{'}anglais dans la plupart des corpus d{'}apprentissage. Cet article d{\'e}crit le corpus utilis{\'e}, l{'}entra{\^\i}nement des mod{\`e}les ainsi que leur {\'e}valuation. Les mod{\`e}les, les donn{\'e}es et le code qui en r{\'e}sultent sont publi{\'e}s sous licences ouvertes, et partag{\'e}s sur Hugging Face et GitHub.",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="louradour-etal-2024-claire">
<titleInfo>
<title>Claire: Large Language Models for Spontaneous French Dialogue</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jérôme</namePart>
<namePart type="family">Louradour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Hunter</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Ismaïl</namePart>
<namePart type="family">Harrando</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Guokan</namePart>
<namePart type="family">Shang</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Virgile</namePart>
<namePart type="family">Rennard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jean-Pierre</namePart>
<namePart type="family">Lorré</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous présentons la famille de modèles Claire, une collection de modèles de langage conçus pour améliorer les tâches nécessitant la compréhension des conversations parlées, tel que le résumé de réunions. Nos modèles résultent de la poursuite du pré-entraînement de deux modèles de base exclusivement sur des transcriptions de conversations et des pièces de théâtre. Aussi nous nous concentrons sur les données en français afin de contrebalancer l’accent mis sur l’anglais dans la plupart des corpus d’apprentissage. Cet article décrit le corpus utilisé, l’entraînement des modèles ainsi que leur évaluation. Les modèles, les données et le code qui en résultent sont publiés sous licences ouvertes, et partagés sur Hugging Face et GitHub.</abstract>
<identifier type="citekey">louradour-etal-2024-claire</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-taln.36</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>530</start>
<end>548</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Claire: Large Language Models for Spontaneous French Dialogue
%A Louradour, Jérôme
%A Hunter, Julie
%A Harrando, Ismaïl
%A Shang, Guokan
%A Rennard, Virgile
%A Lorré, Jean-Pierre
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%F louradour-etal-2024-claire
%X Nous présentons la famille de modèles Claire, une collection de modèles de langage conçus pour améliorer les tâches nécessitant la compréhension des conversations parlées, tel que le résumé de réunions. Nos modèles résultent de la poursuite du pré-entraînement de deux modèles de base exclusivement sur des transcriptions de conversations et des pièces de théâtre. Aussi nous nous concentrons sur les données en français afin de contrebalancer l’accent mis sur l’anglais dans la plupart des corpus d’apprentissage. Cet article décrit le corpus utilisé, l’entraînement des modèles ainsi que leur évaluation. Les modèles, les données et le code qui en résultent sont publiés sous licences ouvertes, et partagés sur Hugging Face et GitHub.
%U https://aclanthology.org/2024.jeptalnrecital-taln.36
%P 530-548
Markdown (Informal)
[Claire: Large Language Models for Spontaneous French Dialogue](https://aclanthology.org/2024.jeptalnrecital-taln.36) (Louradour et al., JEP/TALN/RECITAL 2024)
ACL
- Jérôme Louradour, Julie Hunter, Ismaïl Harrando, Guokan Shang, Virgile Rennard, and Jean-Pierre Lorré. 2024. Claire: Large Language Models for Spontaneous French Dialogue. In Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position, pages 530–548, Toulouse, France. ATALA and AFPC.