Thèse en cours

Réseaux de neurones profonds pour la reconnaissance d'instances visuelles d'objets dans un contexte adaptatif

FR  |  
EN
Auteur / Autrice : Haoming Zhan
Direction : Hichem Sahbi
Type : Projet de thèse
Discipline(s) : Sciences et technologies de l'information et de la communication
Date : Inscription en doctorat le 18/04/2019
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche : Laboratoire : LIP6

Résumé

FR

L'intelligence artificielle (IA) a connu ces dernières années un grand succès dans plusieurs domaines d'applications comme la vision par ordinateur, le traitement automatique des langues, la reconnaissance de la parole et l'analyse sémantique des contenus. Cependant, la commercialisation de ces solutions nécessite de franchir un gap important qui consiste à adapter ces méthodes à des cas d'usages spécifiques et bien centrés sur les utilisateurs humains. Pour un usage industriel, il est difficile d'anticiper toutes les utilisations potentielles pour un système de reconnaissance visuelle. Les solutions d'intelligence artificielle existantes, basées sur des apprentissages, sont souvent sous-dimensionnées en terme de nombre d'objets possibles ; plus précisément, la reconnaissance d'instances visuelles d'objets nécessite une actualisation permanente et quasi-quotidienne des données et des modèles d'apprentissage ce qui est laborieux et onéreux (e.g., lors de la phrase d'enrôlement d'une nouvelle identité en reconnaissance faciale ou l'ajout d'un nouveau produit dans un magasin avec télé-paiement visuel, etc.). Une autre contrainte à considérer est de pouvoir corriger de façon active les erreurs de détections et de reconnaissances; il y a encore très peu de recherches dans cette direction même si la problématique est importante pour des cas d'usages centrés sur des utilisateurs humains. Enfin, le déploiement de façon industrielle des solutions d'apprentissage automatique (et notamment celles basées sur les modèles profonds) nécessite de traiter la question fondamentale liée à la taille et la rapidité d'exécution de ces modèles