Thèse soutenue

Algorithmes d'apprentissage pour la localisation visuelle de véhicules en temps réel

FR  |  
EN
Auteur / Autrice : Arthur Moreau
Direction : Arnaud de La Fortelle
Type : Thèse de doctorat
Discipline(s) : Informatique temps réel, robotique et automatique
Date : Soutenance le 27/04/2023
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique
Partenaire(s) de recherche : Laboratoire : Centre de robotique (Paris)
établissement de préparation de la thèse : École nationale supérieure des mines (Paris ; 1783-....)
Jury : Président / Présidente : Vincent Lepetit
Examinateurs / Examinatrices : Arnaud de La Fortelle, Valérie Gouet-Brunet, Patric Jensfelt, Bogdan Stanciulescu, Dzmitry Tsishkou
Rapporteurs / Rapporteuses : Valérie Gouet-Brunet, Patric Jensfelt

Résumé

FR  |  
EN

La conduite autonome est appelée à révolutionner les transports de demain. Les systèmes de localisation sont un élément clé des véhicules autonomes afin d’assurer une navigation sûre, fluide et fiable. La position d’un véhicule dans son environnement peut être déterminée à l’aide de différents capteurs, utiliser l’image permet de se localiser plus précisement qu’un GPS et requiert uniquement une caméra. Cette thèse vise à résoudre le problème de la relocalisation à l’aide de méthodes d’apprentissage automatique. Nous nous appuyons sur les avancées récentes dans le domaine de l’apprentissage profond pour développer des algorithmes qui apprennent à localiser la position de la caméra à partir d’une grande base de données d’images recueillies dans la zone d’intérêt. Tout d’abord, nous étudions la capacité des réseaux de neurones convolutionnels à être utilisées comme système de localisation de véhicules dans des scénarios de conduite autonome. Dans un second temps, nous avons exploré le lien entre les représentations implicites de scènes et les algorithmes de localisation visuelle. Ces représentations implicites génerent des images synthétiques utilisées pour entraîner de meilleurs algorithmes, mais aussi pour représenter la carte de l’environnement. Nous montrons que les informations pertinentes capturées sur des routes de plusieurs kilomètres peuvent être encodées en quelques mégabytes afin de réaliser la localisation de véhicules en temps réel. De plus, nous remplaçons les modèles 3D traditionnels par un Neural Radiance Field (NeRF) dans les méthodes de "features matching". Globalement, ce travail réhabilite les méthodes de regression, qui sont considérées comme moins précises que les méthodes classiques basées sur les features. Au final, l’efficacité des méthodes d’apprentissages dépend des données et peut donc être bénéfique dans certaines situations, comme la conduite autonome.