Institut des Systèmes Intelligents
et de Robotique

Partenariats

UPMC

CNRS

INSERM

Tremplin CARNOT Interfaces

Labex SMART

Rechercher

Titre : "Taxonomie du comportement de consommateurs par le suivi de la pose et du regard".



La soutenance se déroulera le mercredi 9 octobre à 14h00 dans la salle suivante :

UPMC - Campus Jussieu, 4 Place Jussieu - 75005 Paris

Amphi Durand (Bâtiment Esclangon)

 

Jury :

Rapporteurs :

M. Renaud Séguier,  Professeur à Supélec (IETR)
M. Thierry Chateau,  Professeur à l'Université Blaise Pascal (Institut Pascal)

Examinateurs :

M. Matthieu Cord,   Professeur à l'Université Pierre et Marie Curie (LIP6)
M. Kévin Bailly,   Maître de conférence à l'Université Pierre et Marie Curie (ISIR)

Directeur de thèse :

M. Lionel Prévost,  Professeur à l'Université des Antilles et de la Guyane (LAMIA)

Co-encadrant :

M. Erwan Bigorgne, Docteur à l'Université Pierre et Marie Curie (Eikeo)


Résumé :
Cette thèse s'inscrit dans le cadre du projet O'Sell, fruit d'une collaboration entre l'entreprise Eikeo et le laboratoire ISIR. Les thèmes abordés s'articulent autour de trois outils de vision par ordinateur permettant une analyse du comportement du consommateur: un estimateur de la pose du visage, un estimateur de la direction du regard et un estimateur du genre et de l'âge.

Le suivi de la pose fournit une mesure de la direction de l'attention du consommateur et permet d'initialiser les autres processus du projet. Notre méthode utilise une métrique composite qui permet d'optimiser le suivi d'un visage inconnu avec un modèle facial 3D déformable. Le suivi est validé sur notre base de vidéos dont la vérité terrain est acquise par capture de mouvement. Ce protocole expérimental permet d'affirmer que nous estimons la pose avec une grande précision.

Le suivi du regard à distance a pour objectif d'affiner la mesure de l'attention du consommateur sans équipement porté. Ce suivi est effectué par une illumination infrarouge de la cornée. Les principes utilisés reprennent ceux de méthodes existantes dans des conditions d'applications non optimales. En effet, le cahier des charges du projet nous impose un champ de capture relativement large et interdit toute coopération des consommateurs. Il est ainsi impossible d'obtenir des résolutions élevées sur les cornées ou de calibrer le système pour chaque individu. Malgré ces contraintes, nous obtenons une précision du suivi du regard qui affine notre mesure de l'attention.

La segmentation démographique permet de catégoriser les consommateurs suivis. Elle se base sur une description multi-échelle de l'apparence du visage. Un estimateur de genre et des estimateurs d'âge spécifiques à un genre sont appris sur une large base de données collectée sur internet. L'identification du genre a la capacité d'augmenter ses performances en rejetant des images pendant une séquence vidéo. Les deux estimateurs montrent des performances comparables à celles de l'état de l'art et d'experts humains.