Intelligence Artificielle en Bordure de Réseau pour la Fusion d'Images Multimodale
Auteur / Autrice : | Yoann Dupas |
Direction : | Denis Trystram, Christophe Cerin |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 14/11/2022 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique de Grenoble |
Mots clés
Résumé
L'objectif de cette thèse est de concevoir des techniques d'intelligence artificielle pour la fusion d'images visible, infra-rouge et LIDAR. L'intérêt et l'enjeu de tels systèmes multi-caméras réside en leur capacité à s'affranchir des limitations des IA utilisant leurs images comme source : un CNN entraîné sur des images ne permet pas de faire la distinction entre une personne réelle et la photo d'une personne se trouvant sur un poster. Une caméra IR ou un LIDAR permettent d'apporter des informations supplémentaires permettant de corriger de telles erreurs. Des amorces de travaux ont déjà été effectuées pour fusionner les informations d'images visible-IR [LI2018], visible-LIDAR [CUI2020], et IR-LIDAR [CHOI2021]. Outre le fait que la fusion d'images visible-IR-LIDAR ne soit pas traitée, l'état de l'art implique le plus souvent l'utilisation de réseaux de neurones profonds et implique la mise en uvre d'architectures cloud ou l'utilisation d'importantes capacités de calcul : ces approches sont incompatibles avec le domaine des objets connectés, les traitements en bordure de réseau sont inenvisageables ; et la consommation d'énergie de ces approches n'a ni été estimée et n'a pas fait partie des critères de sélection des choix scientifiques et technologiques. Dans le cadre de cette thèse, il s'agira de concevoir des algorithmes de détection d'objets dans des images multimodales. Deux approches pourront être envisagées : 1. Apprentissage de classifieurs sur des images visibles, IR et LIDAR indépendamment les uns des autres puis fusion de leurs résultats ; où 2. Fusion des images de manière à obtenir des images 7d (r, g, b, IR, x, y, z) puis apprentissage d'un classifieur sur de telles images. L'apprentissage des classifieurs utilisera des techniques issues du Deep Learning : CNN, transfert learning, contrastive learning etc. Si l'apprentissage de ces classifieurs pourra faire appel des serveurs spécialisés dans l'IA, les inférences devront pouvoir être réalisées sur des calculateurs en bordure de réseaux (Edge Computing) de type NVIDIA TX2, NVIDIA Orin ou Google Coral ; et pour limiter la consommation énergétique des algorithmes, des techniques de compression et de quantification de réseaux de neurones seront envisagées