Comment l'imagerie polarimétrique peut contribuer à l'analyse profonde de scènes routières en conditions météorologiques dégradées
Auteur / Autrice : | Rachel Blin |
Direction : | Samia Ainouz |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 28/09/2021 |
Etablissement(s) : | Normandie |
Ecole(s) doctorale(s) : | École doctorale mathématiques, information et ingénierie des systèmes (Caen) |
Partenaire(s) de recherche : | Établissement de préparation : Institut national des sciences appliquées Rouen Normandie (Saint-Etienne-du-Rouvray ; 1985-....) |
Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...) | |
Jury : | Président / Présidente : Frédéric Precioso |
Examinateurs / Examinatrices : Samia Ainouz, Véronique Berge-Cherfaoui, Vincent Frémont, Stéphane Canu, Fabrice Mériaudeau, Olivier Morel | |
Rapporteurs / Rapporteuses : Véronique Berge-Cherfaoui, Vincent Frémont |
Mots clés
Mots clés contrôlés
Résumé
Les véhicules autonomes et les ADAS ont connu des améliorations remarquables ces dernières années grâce à une analyse plus précise et plus fiable des scènes routières. Ces améliorations sont principalement dues à l'émergence de l'apprentissage profond, qui permet une détection très précise des obstacles routiers. Cependant, même si l'on trouve aujourd'hui des véhicules autonomes dans plusieurs pays, ils atteignent leurs limites lorsque la visibilité est altérée. Les modalités non conventionnelles sont la meilleure solution pour surmonter ces limitations, grâce à leur capacité à voir au-delà de la vision humaine, sans pour autant être robustes à tout test. Dans cette thèse, nous répondons à ce défi en utilisant l'imagerie polarimétrique, décrivant les objets par leurs propriétés physiques, invariantes aux changements de visibilité. Dans cette thèse, le concept de multimodalité est d'abord introduit. Le formalisme de polarisation est détaillé, suivi par les modèles colorimétriques, visant à représenter la vision trivariante humaine. L'imagerie infrarouge et les nuages de points LiDAR sont également abordés, car ils jouent un rôle important dans la navigation autonome. La théorie de l'apprentissage profond, notamment les réseaux de neurones convolutifs, est ensuite abordé. Parmi eux, les détecteurs d'objets sont décrits car ils jouent un rôle important dans cette thèse. Un aperçu du CycleGAN est également donné. L'état de l'art vient ensuite faire le pont entre ces deux domaines afin de comprendre comment leur combinaison permet la navigation autonome. Les applications de l'imagerie polarimétrique sont parcourues, ainsi que les limites des modalités non conventionnelles actuellement utilisées dans les systèmes autonomes. Cela permet d'avoir une intuition sur l'utilisation des caractéristiques polarimétriques pour améliorer l'analyse des scènes routières en situations complexes. Les différents détecteurs d'objets sont également présentés, suivis des architectures de fusion multimodale. Ensuite, les jeux de données constitués pour réaliser les expériences nécessaires sont présentés, y compris le processus d'acquisition, leur contenu et leurs étiquettes, ainsi que les formats de données polarimétriques établis. La méthode conçue pour générer des images polarimétriques sous contraintes à partir des images RGB est également esquissée. Les preuves empiriques montrent que l'équivalent polarimétrique des bases de données repères de la littérature permet d'améliorer la détection d'obstacles routiers. Enfin, différentes expériences sont menées pour démontrer que les caractéristiques polarimétriques apprises lorsque la visibilité est bonne peuvent décrire les obstacles routiers dans le brouillard. Ces expériences ont permis de concevoir un schéma de fusion multimodal basé sur l'imagerie couleur et polarimétrique. Ce schéma permet d'améliorer la détection d'objets sous le brouillard et étend les résultats obtenus à d'autres situations, y compris diverses densités de brouillard et la pluie dense.