Institut des Systèmes Intelligents
et de Robotique

Partenariats

Sorbonne Universite

CNRS

INSERM

Tremplin CARNOT Interfaces

Labex SMART

Rechercher

Cours Robotique Cogmaster

khamassi Mehdi
Title : Researcher
Address : 4 place Jussieu, CC 173, 75252 Paris cedex 05
Phone : +33 (0) 1 44 27 28 85
Email : khamassi(at)isir.upmc.fr
Group : AMAC (AMAC)

 

Modélisation Robotique en Sciences Cognitives (CA10)

CogMaster, ENS-EHESS-Paris5, Paris (2018-2019)

Coordinateurs du cours : Mehdi Khamassi et Benoît Girard

Crédits : 6 ECTS - Langue d’enseignement : Français - Volume horaire : 33h de cours (11 x 3h) + 12h de TP (4 x 3h) + 3h d'évaluation finale

2e semestre (5 mars – 11 juin 2019) - Créneau hebdomadaire : Mardi 13h30 – 16h30

Lieu pour les cours : 45 rue des Saintes-Pères, salle R209 si ouverte (2ème étage) sinon salle de Broglie D (1er étage) ;

NEW !!! Lieu pour les TPs : 4 place Jussieu, Pyramide de l'ISIR, entre les tours 55, 56, 65, 66 (plan d'accès : http://www.locations.espaces.upmc.fr/fr/campus.html).

 

Descriptif du cours : L’objectif du cours est d’introduire l’approche robotique des Sciences Cognitives. Comprendre cette approche dans une perspective historique sur son évolution récente par rapport à l’Intelligence Artificielle classique qui se focalisait sur la cognition désincarnée, sur le raisonnement de haut niveau, abstrait et virtuel, mais qui a échoué à intégrer différentes capacités cognitives dans un même agent. Comprendre la dimension incarnée de la robotique (le corps participant à la résolution d’une tâche donnée, et la cognition étant vue comme imbriquée dans des boucles sensori-motrices), sa dimension incrémentale et développementale (l’architecture du contrôleur accumulant progressivement des couches de complexité croissante, comme a pu le faire l’évolution naturelle, et les motivations intrinsèques de l’agent le poussant à acquérir de l’information et des compétences motrices et cognitives de difficulté croissante), sa dimension intégrative de multiples fonctions cognitives (perception, décision, action, contrôle moteur, exploration/curiosité, apprentissage, interaction sociale). Le cours donnera une introduction aux différents méthodes, algorithmes et outils utilisés dans ce champ de la robotique, en insistant sur le lien avec les méthodes de modélisation du cerveau et du comportement humain : apprentissage machine, méthodes de catégorisation des données sensori-motrices, réseaux de neurones, algorithmes de cartographie de type SLAM, méthodes bayésiennes, commande optimale, exploration, motivation. Le cours mettra en avant les interactions récentes de la robotique avec d’autres disciplines lui ayant permis de faire des progrès récents et une fertilisation croisée sur les architectures cognitives (psychologie), le contrôle moteur et la sélection de l’action (neurosciences), la navigation et l’apprentissage (informatique), l’imitation et l’interaction sociale (psychologie développementale). En particulier, le cours insistera sur les développements récents en robotique cognitive reposant sur une interaction de plus en plus forte avec les neurosciences computationnelles, ceci permettant à la fois d’enrichir les capacités cognitives des robots en s’inspirant de modèles du cerveau et d’utiliser le robot comme une plateforme de test en condition réelle de modèles computationnels auparavant validés dans des simulations simplifiées. Un des points importants du cours consistera à illustrer comment la modélisation robotique en Sciences Cognitives peut apporter des connaissances complémentaires par rapport à la simulation de modèles. La dernière impliquant le plus souvent une simulation parfaite et simplifiée du monde, l’expérimentation robotique oblige à faire des hypothèses sur l’interaction entre processus cognitifs. Elle permet également d’extraire et d’analyser de nouvelles propriétés des dynamiques sensori-motrices pouvant contribuer à étendre les modèles simulés existants et à faire de nouvelles prédictions expérimentales liées aux activités cérébrales sous-jacentes chez l’humain.

Prérequis : Le cours nécessite quelques connaissances mathématiques sur les probabilités, le calcul différentiel (fonctions, dérivées, intégrales, notion d’équations aux dérivées partielles), des éléments d’algèbre linéaire (vecteurs, matrices), et des connaissances de base en informatique/programmation pour les ateliers de mise en pratique et le projet (incluant le plus souvent une simulation robotique d’un modèle computationnel).

Les étudiants sont fortement encouragés à suivre ce cours parallèlement à C06 « Introduction aux neurosciences computationnelles » et CA6(b) « Introduction à l’apprentissage machine appliqué aux neurosciences et à la cognition ». Il est également recommandé mais pas obligatoire d’avoir suivi au 1er semestre le cours CA6(a) « Cours avancé en neuroscience théorique ».

Validation : Synthèse d’article (avec réplication des simulations du modèle computationnel proposé dans l'article) présentée à l’oral (voir liste d'articles proposés en bas de page) + notes de TPs. Les TPs seront pour certains en matlab, pour les autres en python. Cliquer ici pour télécharger un document pdf donnant la correspondance entre commandes python/matlab. Cliquer ici pour télécharger une présentation en pdf donnant un guide/tutoriel python numerical computing pour les utilisateurs matlab.

 

Contenu du cours : 11 séances de 3h (Intervenants entre parenthèses) + 4 séances de 3h de TP + 1 séance de 3h (présentation des étudiants)
05/03/2019 Introduction du cours : vers un modèle robotique des architectures cognitives (Mehdi Khamassi / Raja Chatila) pdf
12/03/2019 Perception active (Bruno Gas) pdf article
19/03/2019 Apprentissage par renforcement (RL) et Deep RL (Olivier Sigaud) pdf vidéos
26/03/2019 Apprentissage par renforcement avec et sans replay pour les neurosciences et la robotique (Mehdi Khamassi) pdf
02/04/2019 Deep learning (Charles Ollion, HEURITECH) pdf1 pdf2 pdf3 more
09/04/2019 Séance de mise en pratique TD/TP sur l'apprentissage par renforcement 1 (Nicolas Perrin
16/04/2019 Séance de mise en pratique TD/TP sur l'apprentissage par renforcement 2 (Nicolas Perrin
23/04/2019 Cognition spatiale (Angelo Arleo) pdf
30/04/2019 Contrôle moteur (Emmanuel Guigonpdf
14/05/2019 Approches Bayésiennes (Pierre Bessièrepdf annex1 annex2
21/05/2019 Signal social / Imitation / Perception et émotion pour l’interaction (Mohamed Chetouani / Philippe Gaussierpdf1 pdf2
T.B.D. Séance de mise en pratique TD/TP sur la reconnaissance d'émotions (Mohamed Chetouani)
28/05/2019 Coordination de stratégies de navigation (Benoît Girardpdf
T.B.D. Séance de mise en pratique TD/TP sur la navigation multi-stratégies (Alexandre Coninx)
04/06/2019 Robotique collective et évolutionniste (Nicolas Bredèche / Stéphane Doncieuxpdf1 pdf2
11/06/2019 Evaluation (présentation orale des synthèses d’articles) (Pierre Bessière + Benoît Girard + Mehdi Khamassi + Olivier Sigaud + T.B.D.)

 

Liste d'articles proposée pour la synthèse (évaluation finale) :

L'exercice consiste à faire une synthèse d’article avec réplication des simulations du modèle/algorithme proposé dans l'article. Le premier objectif est de voir si les résultats sont réplicables. Le deuxième est de comprendre plus en profondeur le modèle/algorithme en le prenant en main et en le simulant. Le troisième objectif est d'apporter un regard critique sur les limites de ce modèle/algorithme (soit en proposant une amélioration du modèle, soit en proposant une analyse fondée sur des simulations supplémentaires du même modèle [par exemple sur d'autres données ou dans un autre scénario], soit une critique du modèle lui-même ou de la méthode de l'article, soit une discussion au regard des autres modèles/algorithmes de l'état de l'art).

Comparée aux années précédentes, la liste proposée d'articles est réduite car nous avons voulu au mieux tenir compte des feedback des étudiants sur le fait qu'il y avait auparavant trop d'hétérogénéité entre des articles présentant des modèles difficiles à reprogrammer, et d'autres au contraire trop faciles. Ici, nous avons choisi une liste restreinte d'articles pour lesquels nous avons vérifié que le code source est accessible en ligne.

Le but de l'exercice est que vous preniez en main le code source, essayiez de répliquer les courbes de résultats de l'article, et que vous exploriez ensuite une direction dans laquelle vous pouvez apporter un regard critique sur le modèle. Par exemple, les courbes de l'article original montrent des résultats sur 1 seule simulation, sans barre d'erreur ni tests statistiques. Alors vous pourriez faire plusieurs simulations puis vérifier par un test stat que les résultats sont significatifs. Autre exemple : le modèle semble très sensible aux valeurs des paramètres, alors que l'article original choisit un jeu de paramètres sans le justifier. Alors vous pourriez lancer des simulations avec des jeux de paramètres différents pour étudier l'évolution de la performance du modèle dans l'espace des paramètres. Dernier exemple : le modèle semble s'appliquer à un cas très précis et pourrait ne pas bien généraliser à des situations différentes. Alors vous pourriez imaginer une tâche légèrement différente sur laquelle vous simulez le modèle pour voir s'il se comporte bien ou pas dans cette nouvelle situation.

Le jour de la soutenance, vous aurez 10 minutes pour présenter votre travail avec des transparents, suivies par 10 minutes de questions. Il faudra que votre présentation comprenne :

- une présentation du contexte scientifique et de la question principale posée par l'article original

- une description du modèle original

- une présentation d'une partie des résultats originaux de l'article (ceux que vous allez répliquer et discuter)

- puis vous soulevez 1 ou 2 questions critiques sur le modèle et vous expliquez comment vous proposez d'aborder le problème

- une présentation de vos propres résultats

- une discussion générale

Pour voir la liste d'articles proposés, il faut être inscrit au cours CA10 sur schoology :

https://app.schoology.com/course/1728822030/materials