Thèse soutenue

L'utilisation de Quadtree dans les Réseaux de Neurones Profonds pour Représenter les Données pour la Navigation à partir d'une Caméra Monoculaire

FR  |  
EN
Auteur / Autrice : Daniel Braun
Direction : Cédric DemonceauxOlivier MorelPascal Vasseur
Type : Thèse de doctorat
Discipline(s) : Instrumentation et informatique de l'image
Date : Soutenance le 14/12/2022
Etablissement(s) : Bourgogne Franche-Comté
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur et microtechniques (Besançon ; 1991-....)
Partenaire(s) de recherche : Laboratoire : Imagerie et Vision Artificielle (ImVia) (Dijon)
Etablissement de préparation : Université de Bourgogne (1970-....)
Jury : Président / Présidente : Thierry Chateau
Rapporteurs / Rapporteuses : Sylvie, Julie Chambon, Vincent Frémont

Résumé

FR  |  
EN

L'acquisition de la profondeur représente un élément clé pour les tâches de navigation. Il fait donc partie des principaux sujets de recherche en vision par ordinateur. De nombreuses approches ont été développées pour répondre à ce problème en construisant la profondeur à partir d'une série d'images. Toutefois, il existe un cas minimal proposant une prédiction à partir d'une seule image, rendu possible avec l'émergence des approches d'apprentissage profond. Ces dernières permettent ainsi d'envisager une réduction des coûts en matériel et en temps de calcul, ce qui est bénéfique pour les systèmes embarqués. Cependant, l'architecture du réseau reste un processus lourd nécessitant beaucoup de mémoire du GPU. Certaines approches ont proposé de résoudre ce problème en développant des architectures légères, permettant une exécution en temps réel. Nous proposons ici d'étudier ce problème sous un autre angle, consistant à sélectionner soigneusement les opérations à exécuter plutôt que d'alléger l'architecture. Nos travaux s'appuient sur les réseaux générateurs de quadtree qui tirent parti des convolutions éparses pour n'effectuer que les opérations nécessaires à la génération du quadtree, réduisant ainsi le coût de calcul. Cette méthode, initialement développée pour la segmentation sémantique, sera appliquée dans cette étude aux problèmes d'acquisition de données pour la navigation. À savoir, la segmentation d'images pour l'évitement d'obstacles et la génération de cartes de profondeur compressées en quadtree. Il sera démontré, à travers une série d'expériences, que la compression en quadtree permet une réduction significative du besoin en mémoire avec une perte limitée de précision. Le niveau de compression de la prédiction est entièrement réglable pour l'estimation de la profondeur, ce qui la rend adaptable à toutes les situations.