@inproceedings{sagot-etal-2025-colaf,
title = "{COL}a{F} : Corpus et Outils pour les Langues de {F}rance et vari{\'e}t{\'e}s de fran{\c{c}}ais",
author = "Sagot, Beno{\^i}t and
Ouni, Slim and
Bigeard, Sam and
Ing, Lucence and
Cl{\'e}rice, Thibault and
Bawden, Rachel and
Vincent, Emmanuel and
Yaich, Malek and
Tsolakis, Panagiotis and
Jan{\`e}s, Juliette and
Dent, Rasul and
N{\'e}dey, Oriane and
Colotte, Vincent and
Sadeghi, Mostafa",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de la session industrielle de CORIA-TALN 2025",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-industrielle.3/",
pages = "33--47",
language = "fra",
abstract = "Nous pr{\'e}sentons COLaF, un projet d{\'e}di{\'e} {\`a} la collecte et au d{\'e}veloppement d{'}outils et de ressources de traitement automatique des langues (TAL) pour le fran{\c{c}}ais et les autres langues de France, avec une attention particuli{\`e}re sur les langues et vari{\'e}t{\'e}s moins dot{\'e}es. Le projet concerne les donn{\'e}es textuelles, audio et vid{\'e}o, afin de fournir des corpus et des outils pour le langage {\'e}crit, parl{\'e} et sign{\'e}. Le projet inclut la collecte, la normalisation et la documentation de donn{\'e}es pr{\'e}existantes, y compris des donn{\'e}es actuellement non accessibles ou non exploitables {\`a} des fins de recherche, ainsi que le d{\'e}veloppement d{'}outils de TAL adapt{\'e}s {\`a} ces langues, comme des outils pour l{'}annotation linguistique et pour la traduction automatique. Cet article permet la pr{\'e}sentation des principaux d{\'e}fis pos{\'e}s par le projet et de premiers r{\'e}sultats."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="sagot-etal-2025-colaf">
<titleInfo>
<title>COLaF : Corpus et Outils pour les Langues de France et variétés de français</title>
</titleInfo>
<name type="personal">
<namePart type="given">Benoît</namePart>
<namePart type="family">Sagot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Slim</namePart>
<namePart type="family">Ouni</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Sam</namePart>
<namePart type="family">Bigeard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lucence</namePart>
<namePart type="family">Ing</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thibault</namePart>
<namePart type="family">Clérice</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Rachel</namePart>
<namePart type="family">Bawden</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Vincent</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Malek</namePart>
<namePart type="family">Yaich</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Panagiotis</namePart>
<namePart type="family">Tsolakis</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Juliette</namePart>
<namePart type="family">Janès</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Rasul</namePart>
<namePart type="family">Dent</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Oriane</namePart>
<namePart type="family">Nédey</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Vincent</namePart>
<namePart type="family">Colotte</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Mostafa</namePart>
<namePart type="family">Sadeghi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la session industrielle de CORIA-TALN 2025</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous présentons COLaF, un projet dédié à la collecte et au développement d’outils et de ressources de traitement automatique des langues (TAL) pour le français et les autres langues de France, avec une attention particulière sur les langues et variétés moins dotées. Le projet concerne les données textuelles, audio et vidéo, afin de fournir des corpus et des outils pour le langage écrit, parlé et signé. Le projet inclut la collecte, la normalisation et la documentation de données préexistantes, y compris des données actuellement non accessibles ou non exploitables à des fins de recherche, ainsi que le développement d’outils de TAL adaptés à ces langues, comme des outils pour l’annotation linguistique et pour la traduction automatique. Cet article permet la présentation des principaux défis posés par le projet et de premiers résultats.</abstract>
<identifier type="citekey">sagot-etal-2025-colaf</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-industrielle.3/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>33</start>
<end>47</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T COLaF : Corpus et Outils pour les Langues de France et variétés de français
%A Sagot, Benoît
%A Ouni, Slim
%A Bigeard, Sam
%A Ing, Lucence
%A Clérice, Thibault
%A Bawden, Rachel
%A Vincent, Emmanuel
%A Yaich, Malek
%A Tsolakis, Panagiotis
%A Janès, Juliette
%A Dent, Rasul
%A Nédey, Oriane
%A Colotte, Vincent
%A Sadeghi, Mostafa
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes de la session industrielle de CORIA-TALN 2025
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F sagot-etal-2025-colaf
%X Nous présentons COLaF, un projet dédié à la collecte et au développement d’outils et de ressources de traitement automatique des langues (TAL) pour le français et les autres langues de France, avec une attention particulière sur les langues et variétés moins dotées. Le projet concerne les données textuelles, audio et vidéo, afin de fournir des corpus et des outils pour le langage écrit, parlé et signé. Le projet inclut la collecte, la normalisation et la documentation de données préexistantes, y compris des données actuellement non accessibles ou non exploitables à des fins de recherche, ainsi que le développement d’outils de TAL adaptés à ces langues, comme des outils pour l’annotation linguistique et pour la traduction automatique. Cet article permet la présentation des principaux défis posés par le projet et de premiers résultats.
%U https://aclanthology.org/2025.jeptalnrecital-industrielle.3/
%P 33-47
Markdown (Informal)
[COLaF : Corpus et Outils pour les Langues de France et variétés de français](https://aclanthology.org/2025.jeptalnrecital-industrielle.3/) (Sagot et al., JEP/TALN/RECITAL 2025)
ACL
- Benoît Sagot, Slim Ouni, Sam Bigeard, Lucence Ing, Thibault Clérice, Rachel Bawden, Emmanuel Vincent, Malek Yaich, Panagiotis Tsolakis, Juliette Janès, Rasul Dent, Oriane Nédey, Vincent Colotte, and Mostafa Sadeghi. 2025. COLaF : Corpus et Outils pour les Langues de France et variétés de français. In Actes de la session industrielle de CORIA-TALN 2025, pages 33–47, Marseille, France. ATALA \\& ARIA.