Institut des Systèmes Intelligents
et de Robotique

Partenariats

UPMC

CNRS

INSERM

Tremplin CARNOT Interfaces

Labex SMART

Rechercher

A voir également

Profil

gas Bruno
Titre : Professeur
Adresse : 4 place Jussieu, CC 173, 75252 Paris cedex 05
Téléphone : +33 (0) 1 44 27 28 75
Email : bruno.gas(at)upmc.fr
Equipe : INTERACTION (INTERACTION)

Biographie

Professeur des Universités

Directeur du département "Master Sciences de l'Ingénieur" de l'UPMC

Délégation CNRS en 2008 à L'ISIR

Habilité à Diriger des Recherches depuis 2006

 

Pages recherche

Pages enseignement


Projets de recherche

- Projet Européen STREP FP7 Two!Ears, 2014-2017 (Reading the world with Two!Ears, 9 partenaires)

- Projet ANR International Franco-Japonais BINHAAR, 2010-2013 (Binaural Active Audition for Humanoid Robots, 5 partenaires)

- Projet ANR ASAROME, (Autonomous Sailing Robot for Oceanographic Measurements, 5 partenaires)

 

Thématiques scientifiques :

  • 2008 - Perception active et fusion multimodale pour la robotique mobile et autonome

(UPMC, Institut des Systèmes Intelligents et de Robotique)

Le démarrage de mon actuelle activité de recherche s'effectue dans le cadre de ma délégation CNRS débutée en décembre 2007. Il s'agit de contribuer à ouvrir les robots mobiles à la dimension sonore (audition binaurale), avec deux axes privilégiés: la perception active d'une part et la perception multimodale d'autre part. Un point fort consiste à traiter de ces deux aspects simultanément. L'action n'est pas envisagée ici comme une mobilité donnée aux capteurs pour la recherche d'informations sur l'environnement mais bien comme une composante indispensable de la perception (théorie des contingences sensorimotrices). La fusion multimodale vise à trouver des espaces communs de représentation pour arriver à une unité perceptive. Cette activité de recherche trouve une place naturelle dans le cadre des activités du groupe SIMA (Systèmes Intégrés Mobiles et Autonomes), en particulier dans la participation aux projets ICEA, ASAROME et FASTNAV.

Collaborations: K. O'Regan, A. Decheveigné, LPP, Paris 5/ENS Ulm, P. Danes, LAAS Toulouse, Jens Blauert, Bochum University, Allemagne

  • 1995 - 2006 Extraction de caractéristiques non linéaires et discriminantes de signaux de parole

(UPMC, Laboratoire des Instruments et Systèmes d'Ile de France)

L'analyse du signal de parole, première étape de traitement des systèmes de reconnaissance automatique (parole, locuteur ou langue), est une étape fondamentale mais peu traitée par la communauté. J'ai principalement travaillé pendant ces dix années à la définition et à l'analyse de nouvelles méthodes d'extraction de caractéristiques du signal de parole. En général, l'analyse du signal de parole est fondée sur une modélisation linéaire de type source/filtre de l'organe vocal (codes LPC, LPCC, LAR) mais épousant également des caractéristiques de l'audition huamine (codes MFCC, PLP, etc.). Proposant de reprendre les travaux de Lapedes et Farber sur le filtrage non linéaire, j'ai pu définir une nouvelle structure de réseaux perceptrons multicouches permettant d'extraire des paramètres sensibles aux caractéristiques non linéaires du conduit vocal : les paramètres NPC (Neural Predictive Coding). La validation sur des applications de reconnaissance de phonèmes, de locuteurs et de langues, mais également les différentes extensions proposées ces dernières années auront été le résultat d'un travail d'équipe mené avec Jean-Luc zarader autour de quatre doctorants, Cyril Chavy, Mohamed Chetouani, Sébastien Herry et Christophe Charbuillet.

Plus récemment, depuis 2005, je me suis attaché à montrer que les concepts sous-jacents aux paramètres NPC relevaient de la quantification de fonctions, ce qui m'a permis de proposer une extension des cartes de Kohonen (quantification vectorielle) au domaine de la quantification fonctionnelle (ou vectorielle si l'on veut mais en dimension infinie...).

  • 1994 - 1995 Cartes auto-organisantes pour la perception et l'action en robotique autonome
(ENSEA, Laboratoire ETIS, Cergy Pontoise)
 
Un travail d'un an en tant qu'ATER dans l'équipe Neuro Cybernétique du laboratoire ETIS de l'Ecole Nationale Supérieur de l'Electronique et de ses Applications (ENSEA) sur les cartes auto-organisantes de Kohonen et l'architecture PerAc proposée par P. Gaussier. Application à la robotique mobile.
 
  • 1990 - 1993 Modèles de réseaux de neurones "Spikes" pour l'apprentissage de séquences temporelles
(ESIEE, Marne la Vallée, et Paris Sud, Orsay)
 
Durant mes années de thèse, j'ai consacré mes travaux de recherche à l'étude des modèles connexionnistes récurrents et à trains d'impulsions. Intéressé par la problématique de l'autonomie j'ai appuyé mes travaux sur les observations faites par des auteurs comme Dehaenne et Changeux. "Placez une cellule nerveuse vivante dans un bain physiologique nourricier, vous verrez apparaître la genèse spontanée d'impulsions nerveuses". J'ai supposé qu'une cellule nerveuse dans son milieu naturel, c'est à dire connectée en réseau, pouvait également présenter une activité spontanée, sous certaines conditions comme par exemple une annulation des influences excitatrices et inhibitrices ou une absence d'excitations externes, et en général toute situation se traduisant par un potentiel de membrane à l'équilibre.
Cette hypothèse m'a conduit à proposer une extension du modèle formel de McCulloch et Pitts : un neurone possède deux modes de fonctionnement, un mode "évoqué" - le modèle original - et un mode "spontané" durant lequel le neurone présente en sortie une activité cyclique ou aléatoire, mais dont la propriété est de ne pas dépendre de l'activité de son voisinage. On dérive facilement de ce modèle une loi d'apprentissage non supervisée, c'est à dire dont la fonction de but est définie relativement à l'activité du réseau cellulaire et non à une consigne externe: le réseau bouclé doit conserver une activité évoquée auto-entretenue située entre deux états limites du système, un état irréversible dans lequel toutes les cellules sont spontanées et un état oscillatoire déterministe et saturant pour lequel toutes les cellules sont évoquées. Je présente dans mon mémoire une application de ce modèle à l'apprentissage non supervisé et à la reconnaissance de séquences temporelles.