Thèse soutenue

Approche par apprentissage profond pour l'estimation de la disparité pour des grilles de caméras

FR  |  
EN
Auteur / Autrice : Théo Barrios
Direction : Céline Loscos
Type : Thèse de doctorat
Discipline(s) : Info - Informatique
Date : Soutenance le 30/06/2023
Etablissement(s) : Reims
Ecole(s) doctorale(s) : École doctorale Mathématiques Physique Sciences du Numérique et de l'Ingénieur (Reims ; 2018-)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique en Calcul Intensif et Image pour la Simulation (LICIIS) - UR 3690 LRC DIGIT (Reims, Marne)
Jury : Président / Présidente : Daniel Meneveaux
Examinateurs / Examinatrices : Céline Loscos, Raphaëlle Chaine, Min H. KIM, Nicolas Passat, Stéphanie Prévost
Rapporteurs / Rapporteuses : Raphaëlle Chaine, Min H. KIM

Résumé

FR  |  
EN

La reconstruction 3D à partir d’images est un problème classique en vision par ordinateur dont les solutions diffèrent suivant la configuration du système de captation (2 à n vues, alignées ou non).Cette thèse s'intéresse à la reconstruction 3D basée disparité à partir d'image Ultra HD captée par une grille planaire de caméras à large baseline.La recherche montre un intérêt croissant pour l'utilisation des méthodes d'apprentissage profond pour la reconstruction basée disparité avec des configurations de caméras connexes, notamment en stéréo, stéréo multi-vue et image plénoptique. Toutefois leur adaptation pour des grilles de caméras avec une large baseline et des images d'entrée Ultra HD reste difficile. Nous proposons donc une approche d'apprentissage profond supervisé avec trois contributions. Tout d'abord, une solution de reconstruction générant pour un point de vue (centre, bord, coin), une carte de disparité en Full HD en temps interactif et en moins de 1.5 seconde pour de l’Ultra HD. Pour permettre un entraînement efficace de cette méthode, nous proposons un jeu de données d'entraînement généré de manière procédurale. Ce jeu permet d'entraîner de façon plus robuste des réseaux plus lourds que ceux proposés dans l’état de l’art pour ce type de configuration. Nous proposons enfin une fonction de perte pour l'entraînement des réseaux de neurones augmentant la précision de la reconstruction sans augmenter la quantité d'outliers. Nous mettons également en avant certaines limites dans l'évaluation des méthodes par réseaux de neurones du fait du non-déterminisme de leur entraînement. Les conclusions tirées de nos expériences prennent en compte cette limitation.