L'utilisation de Quadtree dans les Réseaux de Neurones Profonds pour Représenter les Données pour la Navigation à partir d'une Caméra Monoculaire

Daniel Braun

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

L'utilisation de Quadtree dans les Réseaux de Neurones Profonds pour Représenter les Données pour la Navigation à partir d'une Caméra Monoculaire

FR |

EN

Auteur / Autrice :	Daniel Braun
Direction :	Cédric Demonceaux, Olivier Morel, Pascal Vasseur
Type :	Thèse de doctorat
Discipline(s) :	Instrumentation et informatique de l'image
Date :	Soutenance le 14/12/2022
Etablissement(s) :	Bourgogne Franche-Comté
Ecole(s) doctorale(s) :	École doctorale Sciences pour l'ingénieur et microtechniques (Besançon ; 1991-....)
Partenaire(s) de recherche :	Laboratoire : Imagerie et Vision Artificielle (ImVia) (Dijon)
	Etablissement de préparation : Université de Bourgogne (1970-....)
Jury :	Président / Présidente : Thierry Chateau
	Rapporteurs / Rapporteuses : Sylvie, Julie Chambon, Vincent Frémont

Mots clés

FR |

EN

Mots clés contrôlés

Convolutions (mathématiques)

Vision par ordinateur

Traitement d'images -- Techniques numériques

Apprentissage profond

Mots clés libres

Résumé

FR |

EN

L'acquisition de la profondeur représente un élément clé pour les tâches de navigation. Il fait donc partie des principaux sujets de recherche en vision par ordinateur. De nombreuses approches ont été développées pour répondre à ce problème en construisant la profondeur à partir d'une série d'images. Toutefois, il existe un cas minimal proposant une prédiction à partir d'une seule image, rendu possible avec l'émergence des approches d'apprentissage profond. Ces dernières permettent ainsi d'envisager une réduction des coûts en matériel et en temps de calcul, ce qui est bénéfique pour les systèmes embarqués. Cependant, l'architecture du réseau reste un processus lourd nécessitant beaucoup de mémoire du GPU. Certaines approches ont proposé de résoudre ce problème en développant des architectures légères, permettant une exécution en temps réel. Nous proposons ici d'étudier ce problème sous un autre angle, consistant à sélectionner soigneusement les opérations à exécuter plutôt que d'alléger l'architecture. Nos travaux s'appuient sur les réseaux générateurs de quadtree qui tirent parti des convolutions éparses pour n'effectuer que les opérations nécessaires à la génération du quadtree, réduisant ainsi le coût de calcul. Cette méthode, initialement développée pour la segmentation sémantique, sera appliquée dans cette étude aux problèmes d'acquisition de données pour la navigation. À savoir, la segmentation d'images pour l'évitement d'obstacles et la génération de cartes de profondeur compressées en quadtree. Il sera démontré, à travers une série d'expériences, que la compression en quadtree permet une réduction significative du besoin en mémoire avec une perte limitée de précision. Le niveau de compression de la prédiction est entièrement réglable pour l'estimation de la profondeur, ce qui la rend adaptable à toutes les situations.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

L'utilisation de Quadtree dans les Réseaux de Neurones Profonds pour Représenter les Données pour la Navigation à partir d'une Caméra Monoculaire

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

L'utilisation de Quadtree dans les Réseaux de Neurones Profonds pour Représenter les Données pour la Navigation à partir d'une Caméra Monoculaire

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses