Institut des Systèmes Intelligents
et de Robotique

Partenariats

UPMC

CNRS

INSERM

Tremplin CARNOT Interfaces

Labex SMART

Rechercher

Titre : Perception binaurale pour l'analyse de scène auditive en robotique.

La soutenance se déroulera le lundi 14 octobre à 10h00 dans la salle:

Salle 211, Tour 55, 2ème étage, couloir 55-65,
UPMC - Campus Jussieu, 4 Place Jussieu - 75005 Paris.

Le jury sera composé de:

Yves Grenier - Professeur, TELECOM ParisTech - Rapporteur
Hervé Glotin - Professeur, Université de Toulon - Rapporteur
Benoît Fabre - Professeur, UPMC - Examinateur
Marc Rébillat - Maître de Conférences, Arts et Métiers ParisTech - Examinateur
Jean-Luc Zarader - Professeur, UPMC - Directeur de thèse
Sylvain Argentieri - Maître de Conférences, UPMC - Encadrant de thèse



Résumé :

Compte tenu des avancées récentes en robotique interactive, il est intéressant de munir les robots de capacités auditives, et plus spécifiquement dans un contexte humanoïde.
Cette thèse traite les tâches de reconnaissance et localisation de locuteurs (et éventuellement d’autres sources de son). Nous traitons ces problèmes sous l’angle de la robotique humanoïde, impliquant ici des signaux auditifs binauraux. L’approche envisagée pour la reconnaissance de locuteurs montre l'apport du binaural en comparaison avec le monaural et met en évidence sa sensibilité à la position du locuteur et l'importance de la localisation. La localisation fait donc le sujet de la plus grande partie de la thèse. Une comparaison des différents indices proposés dans la littérature pour l'estimation de position est d'abord effectuée, étude d’autant plus importante que ces indices constituent les entrées incontournables de tout système de localisation de sources sonores. Puis, nous présentons notre approche qui consiste en une estimation d’azimut d’une part, puis de distance d’autre part. L’évaluation des systèmes proposés, ainsi que leur comparaison avec les techniques de l’état de l’art, doit prendre en compte des contraintes environnementales ---telle que la présence de bruits et de réverbérations--- rencontrées en robotique. Dans ce but, des bases de données ont été établies, en simulation et en enregistrements réels, incluant ces contraintes. L’évaluation porte sur plusieurs aspects du fonctionnement d’un robot dans une pièce réaliste, et démontre sa fiabilité. Pourtant, une sensibilité à certains changements de conditions entre l’apprentissage et le test de nos systèmes doit être abordée, et peut être contournée par des apprentissages multi-conditionnels. Les travaux effectués supposent la présence d’une seule source sonore d’intérêt (locuteur) dans l’environnement, et n’utilisent que le son. Des propositions d’amélioration sur ces deux aspects sont finalement présentées.