
Nicolas Perrin-Gilbert, chargé de recherche CNRS, soutiendra son Habilitation à Diriger des Recherches (HDR), le jeudi 17 octobre à 16h30 à l’ISIR, sur le campus Pierre et Marie Curie de Sorbonne Université.
Titre de ses travaux : “Ingredients for Motion Planning-powered Reinforcement Learning”.
La constitution du jury est la suivante :
– Aleksandra Faust, Google Deepmind (Rapportrice),
– Matthieu Geist, Université de Lorraine & Cohere (Examinateur),
– Nicolas Mansard, LAAS-CNRS (Rapporteur),
– Jochen J. Steil, Université Technique de Brunswick (Rapporteur),
– Nicolas Thome, Sorbonne Université (Examinateur)
Résumé de son habilitation :
Mon HDR se concentre sur quatre contributions principales, assez distinctes, mais ayant toutes un lien avec un objectif commun, celui d’améliorer l’exploration en apprentissage par renforcement à travers l’utilisation de techniques de planification de mouvements basées sur l’échantillonnage aléatoire.
La première contribution concerne des transformations géométriques entre mouvements continus et séquences discrètes de contacts, ce qui permet d’aborder les problèmes de génération de mouvements de locomotion sous un angle nouveau. La deuxième contribution propose une technique de généralisation ou d’imitation de trajectoires basée sur l’application de transformations difféomorphiques successives. La troisième porte sur la gestion de séquences successives d’objectifs, en particulier sur les notions de buts intermédiaires et les façons de les considérer pour atteindre plus efficacement un objectif global. Enfin, la quatrième contribution présente un algorithme d’apprentissage par renforcement dit « off-policy », visant à améliorer l’entraînement de politiques de contrôle lorsqu’une partie significatives des données provient de trajectoires d’exploration.
Contact : Nicolas Perrin-Gilbert, chargé de recherche CNRS
Publié le 14/10/2024.