Thèse soutenue

Adaptation de domaine non supervisée pour modèle de suivi multi-partie et identification visuelle appliquée à l'interaction homme-robot
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Guillaume Delorme
Direction : Radu HoraudXavier Alameda-Pineda
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 08/10/2021
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Jean Kuntzmann (Grenoble)
Equipe de recherche : Interpretation and Modelling of Images and Videos (PERCEPTION)
Jury : Président / Présidente : Vincent Lepetit
Examinateurs / Examinatrices : Radu Horaud, Xavier Alameda-Pineda
Rapporteurs / Rapporteuses : Alberto Del Bimbo, Lourdes Agapito

Résumé

FR  |  
EN

L’interaction homme-robot nécessite que ce dernier ait une connaissance précise de son environnement, tout particulièrement qui est présent et où, afin de permettre une conversation réaliste et interactive. À cette fin, cette thèse propose d’exploiter l’information contenue dans les images récoltées par la caméra du robot afin de réaliser du suivi multi-partie, utilisant la proximité temporelle et spatiale afin de produire des trajectoires exploitable à des fins d’identification. L’état de l’art est basé sur des approches d’apprentissage pro-fond, qui sont connus pour dépendre grandement des données utilisées lors de l'entraı̂nement et, ont donc une mauvaise capacité de généralisation à de nouveaux domaines. Une grande partie des modèles de suivis utilisent notamment des modèles de ré-identification de personnes comme descripteur d’apparence, alors que ceux-ci sont connu comme étant très sensible aux changements d’arrière plan, ou de conditions d’illumination. Ce travail se concentre donc sur l’investigation des stratégies d’adaptation à de nouveaux domaines pour les modèles de suivis et de ré-identification de personnes. Un modèle probabiliste est d’abord proposé pour implémenter un algorithme de suivi multi-partie qui, combiné avec un modèle d’apparence profond mis à jour en utilisant les annotations des trajectoires passées, est capable de s’adapter au domaine cible en temps réel, ceci dans un contexte robotique. Cette stratégie est quantitativement évaluée sur un datas et standard de suivi multi-partie, et une implémentation sur une plateforme robotique fournit des résultats qualitatifs. Ensuite, inspiré de la littérature de l’adaptation aux nouveaux domaines, une stratégie d’entraı̂nement adversaire basée sur l’information de caméra est proposée dans le cadre de la ré-identification de personne non supervisée. Cette approche démontre une performance compétitive comparé à l’état de l’art en ré-identification. Cette approche est davantage explorée à travers la nouvelle stratégie de partitionnement et d’entraı̂nement. Une variante conditionnelle est explorée pour atténuer le problème de transfert négatif, causé par la répartition non uniforme des identités d’entraı̂nement sur les caméras. Cette idée est implémentée sur deux modèles de l’état de l’art, et permet de les améliorer. Enfin, le cadre de l’adaptation de domaine adversaire est explorée dans le contexte du suivi multi-partie, et combiné avec une stratégie de suivi et d’entraı̂nement, un algorithme d’apprentissage est proposé, et sa supériorité vis à vis des stratégies d’adaptation concurrentes est démontrée.