Navigation visuelle pour l'exploration de cavités volcaniques extraterrestres
Auteur / Autrice : | César Debeunne |
Direction : | Damien Vivet |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique et Télécommunications |
Date : | Soutenance le 25/11/2024 |
Etablissement(s) : | Toulouse, ISAE |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications (Toulouse) |
Partenaire(s) de recherche : | Equipe de recherche : Équipe d'accueil doctoral Signal, communication, antenne et navigation, radar (Toulouse, Haute-Garonne) |
Laboratoire : Institut supérieur de l'aéronautique et de l'espace (Toulouse, Haute-Garonne). Département électronique, optronique et signal | |
Jury : | Président / Présidente : Olivier Stasse |
Examinateurs / Examinatrices : Damien Vivet, Teresa Vidal-Calleja, Vincent Frémont, Romuald Aufrère | |
Rapporteurs / Rapporteuses : Teresa Vidal-Calleja, Vincent Frémont |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
L’étude des tunnels de lave sur la Lune et sur Mars révèle que ces artefacts géologiques peuvent servir d’abris à de potentielles installations humaines. L’exploration robotique des ces cavités est nécessaire pour confirmer ces hypothèses et ouvrir la voie à une hypothétique base lunaire. L’estimation d’état en environnement souterrain se révèle cependant compliquée, surtout lorsqu’on prend en compte les contraintes imposées par le matériel spatial. Nous proposons dans cette thèse, d’étudier une méthode de navigation basée sur la vision pour assurer l’autonomie de tels robots.Les missions MER et MSL reposent déjà en partie sur la navigation visuelle. Mais pour satisfaire les contraintes imposées par les calculateurs des rovers, les méthodes utilisées sont plus simples que l’état de l’art implémenté sur les robots terrestres. En particulier, en absence de signal GPS, la robotique terrestre utilise des algorithmes de cartographie et de localisation simultanée (SLAM). Ces derniers peuvent être basés sur du filtrage ou sur de l’optimisation. De nos jours, l’état de l’art en SLAM visuel est basé optimisation au travers du formalisme graphe de facteurs. Nous proposons d’étudier l’implémentation d’un SLAM visuel basé graphe de facteurs respectant les contraintes spatiales et assurant une navigation robuste en environnement souterrain.La solution que nous proposons extrait des points saillants dans l’image courante. Ces points peuvent être associés dans l’image suivante en utilisant des descripteurs locaux ou grâce au flux optique. Une fois les points associés sur au moins deux images, ils peuvent être triangulés pour former une carte métrique. Cette carte peut être utilisée pour la localisation et elle est raffinée à chaque nouvelle image d’intérêt en minimisant l’erreur de reprojection des points triangulés. Un tel algorithme repose sur des briques algorithmiques qui peuvent prendre des formes variées (type de points saillants, descripteurs, méthode d’association, modèle de caméra …). Nous proposons d’étudier individuellement certaines de ces méthodes pour converger vers une solution adaptée à notre contexte. Pour cela, nous avons utilisé un jeu de données publique enregistré dans une grotte, utilisant une matrice LED pour illuminer la scène. Un tel contexte n’est pas idéal pour le SLAM visuel (surexposition, sous exposition, faible texture …), ce qui nous a incité à entamer cette démarche empirique pour développer notre SLAM visuel.Une fois cette solution naïve développée, nous avons cherché à la robustifier en étudiant plus en détail le graphe de facteur. Pour limiter la charge de calcul, la carte que nous utilisons est une carte locale. Elle ne comporte qu’un nombre fixé de poses et d’amers. Lorsque ce nombre est atteint, nous marginalisons les variables en trop et ceci mène à des corrélations supplémentaires dans le problème de SLAM. Il se densifie et demande donc plus de calculs pour être optimisé. Nous avons donc développé une méthode pour rendre le problème parcimonieux en réduisant les corrélations introduites par la marginalisation à celles qui apportent le plus d’information. Ceci accélère la résolution du problème de SLAM et nous a permis d’atteindre des performances de l’état de l’art à un coup de calcul moindre. Mais la navigation visuelle seule ne permet pas d’observer la direction de la gravité, qui est nécessaire pour identifier des obstacles verticaux. Nous avons étendu la solution proposée à un SLAM visuel inertiel pour rendre cette variable observable. Enfin, pour assurer une navigation fiable, nous avons développé une méthode de reconstruction 3D dense basée sur la carte estimée par notre SLAM. Celle-ci est basée sur la génération d’un mesh 3D en projetant, pour chaque image clé, une triangulation 2D des points saillants. Le modèle 3D obtenu a pu être utilisé pour estimer la traversabilité des environs du robot, une donnée indispensable pour la planification automatique de trajectoire.