Clément Romac
Also published as: Clement Romac
2025
Reinforcement Learning for Aligning Large Language Models Agents with Interactive Environments: Quantifying and Mitigating Prompt Overfitting
Mohamed Salim Aissi
|
Clément Romac
|
Thomas Carta
|
Sylvain Lamprier
|
Pierre-Yves Oudeyer
|
Olivier Sigaud
|
Laure Soulier
|
Nicolas Thome
Findings of the Association for Computational Linguistics: NAACL 2025
Apprentissage par renforcement pour l’alignement des agents LLMs avec des environnements interactifs : quantification et réduction du surapprentissage aux prompts
Mohamed Salim Aissi
|
Clement Romac
|
Thomas Carta
|
Sylvain Lamprier
|
Pierre-Yves Oudeyer
|
Olivier Sigaud
|
Laure Soulier
|
Nicolas Thome
Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publiés
Co-authors
- Mohamed Salim Aissi 2
- Thomas Carta 2
- Sylvain Lamprier 2
- Pierre-Yves Oudeyer 2
- Olivier Sigaud 2
- show all...