Thèse soutenue

Résoudre l’occlusion et la faible densité à distance des nuages de points pour la détection d’objets 3D par perception collaborative

FR  |  
EN
Auteur / Autrice : Minh Quan Dao
Direction : Vincent FrémontElwan Héry
Type : Thèse de doctorat
Discipline(s) : Robotique
Date : Soutenance le 24/11/2023
Etablissement(s) : Ecole centrale de Nantes
Ecole(s) doctorale(s) : Sciences de l'ingénierie et des systèmes (Nantes Université)
Partenaire(s) de recherche : Laboratoire : Laboratoire des Sciences du Numérique de Nantes
Jury : Président / Présidente : Samia Ainouz
Examinateurs / Examinatrices : Ezio Malis, Holger Caesar, Fawzi Nashashibi
Rapporteurs / Rapporteuses : Thierry Chateau, Sergiu Nedevschi

Résumé

FR  |  
EN

La détection précise d’objets 3D est un enjeu majeur pour l’intégration sécurisée des véhicules autonomes dans le trafic routier. Le LiDAR, offrant des mesures de profondeur précises et relativement denses, est très présent dans les bases de données deréférence. Cependant, ses nuages de points sont clairsemés à longue distance et soumis aux occlusions. L’état de l’art propose alors des techniques de suréchantillonnage, par fusion avec des caméras ou par distillation des connaissances, afin d’obtenir de bonnes détections. La première méthode permet de reconstruire la profondeur des pixels afin de générer des points supplémentaires tandis que la seconde vise à obtenir des nuages de points imitant ceux sans occlusion ni dispersion. Comme ces approches utilisent des mesures obtenues par le véhicule ego à chaque pas de temps, la détection est inévitablement affectée par ces régions inobservables. Conscient des limites des méthodes à perspective unique, ces travaux de thèse s’efforcent à résoudre les problèmes d’occlusion et de rareté en exploitant des perspectives multiples. Notre approche exploite d’une part les mesures du véhicule ego par séquences : au cours de son déplacement dans le temps. D’autre part, nous proposons une perception collaborative basée sur la fusion des informations obtenues par de multiples agents connectés.