Home » Équipes » MLIA » Présentation

MLIA

Machine Learning & deep learning for Information Access

L’équipe MLIA mène des recherches centrés sur les thématiques de l’apprentissage statistique (Machine Learning) avec un accent sur les aspects algorithmiques et sur les applications. Les enjeux principaux relèvent de l’analyse de données sémantiques et la modélisation de systèmes physiques complexes.

Positionnement Scientifique

MLIA a été un acteur majeur dans le développement de l’apprentissage profond et des réseaux de neurones en France. Historiquement, elle a été un groupe pionnier dans ce domaine. Ces dernières années, la majorité de la recherche à MLIA se situe dans ce domaine. Nous étudions l’apprentissage profond dans différents domaines, avec un accent particulier sur la vision par ordinateur, le traitement du langage naturel et l’apprentissage profond basé sur la physique.

Domaines d’applications

L’équipe MLIA développe des algorithmes d’apprentissage statistique applicables dans différents domaines, en particulier sur :

MLIA développe des modèles d’apprentissage profond pour l’interprétation de formes visuelles, pour la détection et la reconnaissance d’objets, l’analyse sémantique de scènes et leur description textuelle, et pour la génération d’images. Nous explorons de nouvelles conceptions d’architecture profonde tirant parti des mécanismes de convolution et de ceux basés sur l’attention, comme les transformers.

Nous étudions également toutes les méthodologies d’apprentissage pour la vision, par exemple, le pré-entraînement auto-supervisé, l’apprentissage semi-supervisé et l’adaptation de domaine, l’apprentissage avec peu ou aucune données. Toutes nos stratégies sont déployées dans différentes applications telles que la perception visuelle et l’interaction humaine. En outre, nous examinons sérieusement les problèmes de biais et d’explicabilité de nos solutions d’apprentissage automatique.

MLIA est impliquée dans la recherche d’information et le traitement automatique du langage naturel depuis plusieurs années. Elle a été un pionnier au milieu des années 2000 pour l’introduction de l’apprentissage automatique dans la recherche d’information. Parmi les principaux sujets récents étudiés, citons : (i) la RI interactive, les systèmes conversationnels ou les systèmes de recherche axés sur les tâches, (ii) la génération de texte avec un accent sur la génération de données vers du texte (data-to-text), le résumé abstractif, (iii) l’extraction d’information et la reconnaissance d’entités nommées.

Nous avons également développé des modèles de recommandation basés sur la polarité du texte. L’apprentissage par représentation est un paradigme qui nous permet de mélanger différentes modalités de manière efficace. Combiner les représentations des mots, des phrases et des utilisateurs est une solution puissante pour améliorer les suggestions mais aussi pour les expliquer.

L’observation et l’analyse de processus physiques complexes dans des domaines scientifiques comme l’environnement ou la santé et dans des domaines industriels comme l’aéronautique ou la production d’énergie génèrent de grandes quantités de données. Le principal paradigme de modélisation dans tous ces domaines repose encore sur la connaissance physique, c’est-à-dire qu’il développe des modèles basés sur une compréhension profonde du phénomène physique sous-jacent. Une tendance récente de la recherche consiste à développer l’interaction entre cette approche basée sur les modèles héritée de la physique d’une part et l’apprentissage automatique statistique agnostique d’autre part. Cela soulève plusieurs nouveaux défis pour l’apprentissage automatique. Ce domaine est étudié en coopération avec des mathématiciens appliqués et des spécialistes des sciences de la terre et du climat (LOCEAN Lab Sorbonne Univ.) Outre les avancées centrées sur l’apprentissage automatique, les principaux domaines d’application étudiés par MLIA concernent le climat et la santé.

L’apprentissage par renforcement a été étudié pour différentes applications par MLIA, comme la conduite autonome ou la génération de langage naturel. Le passage de MLIA du LIP6 à l’ISIR, en 2022, et l’importance du domaine pour la robotique, vont mettre de plus en plus l’accent sur ce domaine.

Contact référent : Patrick Gallinari, Responsable de l’équipe MLIA


Suivez l’équipe MLIA sur twitter !