Thèse soutenue

Apprentissage non supervisé pour la segmentation et la saillance du mouvement dans des vidéos

FR  |  
EN
Auteur / Autrice : Étienne Meunier
Direction : Patrick Bouthémy
Type : Thèse de doctorat
Discipline(s) : Signal, image, vision
Date : Soutenance le 04/12/2023
Etablissement(s) : Université de Rennes (2023-....)
Ecole(s) doctorale(s) : MATISSE
Partenaire(s) de recherche : Laboratoire : INRIA-RENNES - Institut national de recherche en informatique et en automatique (France). Unité de recherche (Rennes, Bretagne-Atlantique) - SAIRPICO
Jury : Président / Présidente : Élisa Fromont
Examinateurs / Examinatrices : Patrick Bouthémy, Daniel Cremers, Ronan Fablet
Rapporteurs / Rapporteuses : Nicolas Thome, Patrick Pérez

Résumé

FR  |  
EN

Les contributions de cette thèse sont de deux ordres. Premièrement, nous avons développé une approche non supervisée d'apprentissage profond pour la segmentation du mouvement à partir du flot optique. Nous avons construit à partir de l'algorithme EM une fonction de perte qui implique des modèles de mouvement paramétriques. Nous avons progressivement ajouté de la cohérence temporelle à cette méthode. Avec un triplet de flots en entrée, nous ajoutons un terme de perte imposant des étiquettes cohérentes au sein du triplet. Ensuite, avec des séquences de flot plus longues en entrée, nous définissons une représentation plus fexible du mouvement par splines, et nous nous appuyons sur un transformer pour appréhender des interactions à long terme entre les caractéristiques. Ces méthodes fournissent des résultats compétitifs sur les benchmarks, tout en étant très efficaces en inférence. La deuxième contribution porte sur la localisation des mouvements saillants à partir du flot optique. Nous supposons que les zones saillantes sont celles qui influencent la prédiction d'un réseau pré-entraîné de classification de saillance. Nous exploitons une méthode d'interprétation du réseau de type gradient pour localiser les zones saillantes. Nous avons également conçu une approche alternative par réseau adverse. Nous avons appliqué ces deux méthodes à deux tâches de saillance du mouvement.