Panagiotis Tsolakis


2025

pdf bib
COLaF : Corpus et Outils pour les Langues de France et variétés de français
Benoît Sagot | Slim Ouni | Sam Bigeard | Lucence Ing | Thibault Clérice | Rachel Bawden | Emmanuel Vincent | Malek Yaich | Panagiotis Tsolakis | Juliette Janès | Rasul Dent | Oriane Nédey | Vincent Colotte | Mostafa Sadeghi
Actes de la session industrielle de CORIA-TALN 2025

Nous présentons COLaF, un projet dédié à la collecte et au développement d’outils et de ressources de traitement automatique des langues (TAL) pour le français et les autres langues de France, avec une attention particulière sur les langues et variétés moins dotées. Le projet concerne les données textuelles, audio et vidéo, afin de fournir des corpus et des outils pour le langage écrit, parlé et signé. Le projet inclut la collecte, la normalisation et la documentation de données préexistantes, y compris des données actuellement non accessibles ou non exploitables à des fins de recherche, ainsi que le développement d’outils de TAL adaptés à ces langues, comme des outils pour l’annotation linguistique et pour la traduction automatique. Cet article permet la présentation des principaux défis posés par le projet et de premiers résultats.

pdf bib
MaTOS: Machine Translation for Open Science
Rachel Bawden | Maud Bénard | Maud Bénard | José Cornejo Cárcamo | Nicolas Dahan | Manon Delorme | Mathilde Huguin | Natalie Kübler | Paul Lerner | Alexandra Mestivier | Joachim Minder | Jean-François Nominé | Ziqian Peng | Laurent Romary | Panagiotis Tsolakis | Lichao Zhu | François Yvon
Proceedings of Machine Translation Summit XX: Volume 2

This paper is a short presentation of MaTOS, a project focusing on the automatic translation of scholarly documents. Its main aims are threefold: (a) to develop resources (term lists and corpora) for high-quality machine translation; (b) to study methods for translating complete, structured documents in a cohesive and consistent manner; (c) to propose novel metrics to evaluate machine translation in technical domains. Publications and resources are available on the project web site: https://anr-matos.gihub.io.