@inproceedings{coch-adam-2023-temitalc,
title = "{TEMITALC} : Text Mining et {TAL} pour Analyser le Langage des Cachalots",
author = "Coch, Jose and
Adam, Olivier",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 6 : projets",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-projet.4",
pages = "23--25",
abstract = {Les cachalots (Physeter macrocephalus) sont les plus grands des c{\'e}tac{\'e}s {\`a} dents. Comme tous les c{\'e}tac{\'e}s, ils communiquent notamment par des {\'e}missions vocales. Les cachalots produisent des clics au cours de leurs activit{\'e}s vitales et leurs interactions sociales. Certains de ces sons sont organis{\'e}s en s{\'e}quences temporelles, appel{\'e}es « codas ». Depuis plus d{'}une dizaine d{'}ann{\'e}es, des {\'e}changes audio ou « conversations » entre cachalots sont enregistr{\'e}s dans de nombreux endroits dans le monde, par exemple dans l{'}Oc{\'e}an Pacifique, dans les Cara{\"\i}bes et dans l{'}Oc{\'e}an Indien. La particularit{\'e} des {\'e}changes vocaux entre cachalots fait que ces codas sont num{\'e}risables relativement facilement. Ainsi, il existe des corpus de transcriptions de conversations en particulier venant des origines g{\'e}ographiques cit{\'e}es. Durant 2022, une collaboration entre le Service NLP de Dassault Syst{\`e}mes et l{'}{\'e}quipe Bioacoustique de Sorbonne Universit{\'e}, bas{\'e}e sur les enregistrements sonores collect{\'e}s et mis {\`a} disposition par Longitude 181 et Label Bleu Production, nous a permis d{'}initier un projet d{'}application des techniques de Text Mining et Traitement Automatique du Langage {\`a} l{'}{\'e}tude du langage des cachalots. Nous avons expos{\'e} les premiers r{\'e}sultats du projet dans un article publi{\'e} dans les Actes de l{'}atelier TextMine{'}23 de la conf{\'e}rence EGC{'}2023 concernant un corpus de cachalots r{\'e}sidents au large de l{'}Ile Maurice et identifi{\'e}s individuellement. Nous utilisons dans ce projet le logiciel Proxem Studio, qui a la particularit{\'e} de pouvoir {\^e}tre appliqu{\'e} sans mod{\`e}le de langue pr{\'e}alable car il peut construire des mod{\`e}les de langue {\`a} partir des corpus {\`a} analyser. L{'}objectif du projet couvre les points suivants : - Optimiser et automatiser la transcription en codas des {\'e}changes audio entre cachalots, - Analyser les propri{\'e}t{\'e}s formelles du langage des cachalots : mettre en {\'e}vidence que l{'}ordre entre codas a une importance, et d{\'e}couvrir s{`}il est possible de d{\'e}crire une proto-syntaxe de ce langage, - Mettre au point un r{\'e}f{\'e}rentiel d{'}{\'e}l{\'e}ments non linguistiques (comportements sociaux, donn{\'e}es d{\'e}mographiques, relations familiales) et identifier des codas ou des s{\'e}quences de codas montrant une corr{\'e}lation avec ces {\'e}l{\'e}ments non linguistiques, et in fine, avancer des hypoth{\`e}ses sur la fonction de certaines codas ou s{\'e}quences de codas, - Etudier les corr{\'e}lations entre les participants {\`a} chaque conversation et les codas {\'e}mis afin de d{\'e}terminer si des codas ou s{\'e}quences de codas peuvent {\^e}tre associ{\'e}es {\`a} des individus. Le projet b{\'e}n{\'e}ficie d{'}un financement de Dassault Syst{\`e}mes et de Sorbonne Universit{\'e}. La fin du projet est pr{\'e}vue pour d{\'e}cembre 2024. Nos r{\'e}sultats vont contribuer ainsi {\`a} d{\'e}crire le sophistiqu{\'e} langage d{'}une esp{\`e}ce non-humaine.},
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="coch-adam-2023-temitalc">
<titleInfo>
<title>TEMITALC : Text Mining et TAL pour Analyser le Langage des Cachalots</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">Coch</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Olivier</namePart>
<namePart type="family">Adam</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 6 : projets</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Servan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anne</namePart>
<namePart type="family">Vilnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les cachalots (Physeter macrocephalus) sont les plus grands des cétacés à dents. Comme tous les cétacés, ils communiquent notamment par des émissions vocales. Les cachalots produisent des clics au cours de leurs activités vitales et leurs interactions sociales. Certains de ces sons sont organisés en séquences temporelles, appelées « codas ». Depuis plus d’une dizaine d’années, des échanges audio ou « conversations » entre cachalots sont enregistrés dans de nombreux endroits dans le monde, par exemple dans l’Océan Pacifique, dans les Caraïbes et dans l’Océan Indien. La particularité des échanges vocaux entre cachalots fait que ces codas sont numérisables relativement facilement. Ainsi, il existe des corpus de transcriptions de conversations en particulier venant des origines géographiques citées. Durant 2022, une collaboration entre le Service NLP de Dassault Systèmes et l’équipe Bioacoustique de Sorbonne Université, basée sur les enregistrements sonores collectés et mis à disposition par Longitude 181 et Label Bleu Production, nous a permis d’initier un projet d’application des techniques de Text Mining et Traitement Automatique du Langage à l’étude du langage des cachalots. Nous avons exposé les premiers résultats du projet dans un article publié dans les Actes de l’atelier TextMine’23 de la conférence EGC’2023 concernant un corpus de cachalots résidents au large de l’Ile Maurice et identifiés individuellement. Nous utilisons dans ce projet le logiciel Proxem Studio, qui a la particularité de pouvoir être appliqué sans modèle de langue préalable car il peut construire des modèles de langue à partir des corpus à analyser. L’objectif du projet couvre les points suivants : - Optimiser et automatiser la transcription en codas des échanges audio entre cachalots, - Analyser les propriétés formelles du langage des cachalots : mettre en évidence que l’ordre entre codas a une importance, et découvrir s‘il est possible de décrire une proto-syntaxe de ce langage, - Mettre au point un référentiel d’éléments non linguistiques (comportements sociaux, données démographiques, relations familiales) et identifier des codas ou des séquences de codas montrant une corrélation avec ces éléments non linguistiques, et in fine, avancer des hypothèses sur la fonction de certaines codas ou séquences de codas, - Etudier les corrélations entre les participants à chaque conversation et les codas émis afin de déterminer si des codas ou séquences de codas peuvent être associées à des individus. Le projet bénéficie d’un financement de Dassault Systèmes et de Sorbonne Université. La fin du projet est prévue pour décembre 2024. Nos résultats vont contribuer ainsi à décrire le sophistiqué langage d’une espèce non-humaine.</abstract>
<identifier type="citekey">coch-adam-2023-temitalc</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-projet.4</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>23</start>
<end>25</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T TEMITALC : Text Mining et TAL pour Analyser le Langage des Cachalots
%A Coch, Jose
%A Adam, Olivier
%Y Servan, Christophe
%Y Vilnat, Anne
%S Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 6 : projets
%D 2023
%8 June
%I ATALA
%C Paris, France
%G French
%F coch-adam-2023-temitalc
%X Les cachalots (Physeter macrocephalus) sont les plus grands des cétacés à dents. Comme tous les cétacés, ils communiquent notamment par des émissions vocales. Les cachalots produisent des clics au cours de leurs activités vitales et leurs interactions sociales. Certains de ces sons sont organisés en séquences temporelles, appelées « codas ». Depuis plus d’une dizaine d’années, des échanges audio ou « conversations » entre cachalots sont enregistrés dans de nombreux endroits dans le monde, par exemple dans l’Océan Pacifique, dans les Caraïbes et dans l’Océan Indien. La particularité des échanges vocaux entre cachalots fait que ces codas sont numérisables relativement facilement. Ainsi, il existe des corpus de transcriptions de conversations en particulier venant des origines géographiques citées. Durant 2022, une collaboration entre le Service NLP de Dassault Systèmes et l’équipe Bioacoustique de Sorbonne Université, basée sur les enregistrements sonores collectés et mis à disposition par Longitude 181 et Label Bleu Production, nous a permis d’initier un projet d’application des techniques de Text Mining et Traitement Automatique du Langage à l’étude du langage des cachalots. Nous avons exposé les premiers résultats du projet dans un article publié dans les Actes de l’atelier TextMine’23 de la conférence EGC’2023 concernant un corpus de cachalots résidents au large de l’Ile Maurice et identifiés individuellement. Nous utilisons dans ce projet le logiciel Proxem Studio, qui a la particularité de pouvoir être appliqué sans modèle de langue préalable car il peut construire des modèles de langue à partir des corpus à analyser. L’objectif du projet couvre les points suivants : - Optimiser et automatiser la transcription en codas des échanges audio entre cachalots, - Analyser les propriétés formelles du langage des cachalots : mettre en évidence que l’ordre entre codas a une importance, et découvrir s‘il est possible de décrire une proto-syntaxe de ce langage, - Mettre au point un référentiel d’éléments non linguistiques (comportements sociaux, données démographiques, relations familiales) et identifier des codas ou des séquences de codas montrant une corrélation avec ces éléments non linguistiques, et in fine, avancer des hypothèses sur la fonction de certaines codas ou séquences de codas, - Etudier les corrélations entre les participants à chaque conversation et les codas émis afin de déterminer si des codas ou séquences de codas peuvent être associées à des individus. Le projet bénéficie d’un financement de Dassault Systèmes et de Sorbonne Université. La fin du projet est prévue pour décembre 2024. Nos résultats vont contribuer ainsi à décrire le sophistiqué langage d’une espèce non-humaine.
%U https://aclanthology.org/2023.jeptalnrecital-projet.4
%P 23-25
Markdown (Informal)
[TEMITALC : Text Mining et TAL pour Analyser le Langage des Cachalots](https://aclanthology.org/2023.jeptalnrecital-projet.4) (Coch & Adam, JEP/TALN/RECITAL 2023)
ACL