Thèse soutenue

Etude d’une architecture intégrée de prétraitement du signal pour les imageurs intelligents, dans le contexte de la vision embarquée pour la détection des objets.
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Luis Cubero montealegre
Direction : Gilles Sicard
Type : Thèse de doctorat
Discipline(s) : Nanoélectronique et nanotechnologie
Date : Soutenance le 16/12/2021
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale électronique, électrotechnique, automatique, traitement du signal (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'électronique et de technologie de l'information (Grenoble ; 1967-....)
Jury : Président / Présidente : Alice Caplier
Examinateurs / Examinatrices : Gilles Sicard
Rapporteurs / Rapporteuses : Ricardo Carmona-Galán, Dominique Ginhac

Résumé

FR  |  
EN

Avec la croissance de l’utilisation d’objets connectés, les systèmes de vision embarqués, comme d’autres sujets de l’intelligence artificielle, font face à l’augmentation des contraintes en puissance et en complexité matérielle. Par exemple, la détection des objets définit le problème de localisation et de classification des différents objets présents dans une scène. Cependant, cette détection/classification devient très complexe lorsque ces objets sont de plusieurs types différents et présents à différentes échelles. Actuellement, cette détection des objets est faite en général à l’aide d’ordinateurs assez puissants. Néanmoins, plusieurs applications récentes, comme la conduite autonome, la réalité augmentée, et la surveillance par vidéo, nécessitent des systèmes fortement embarqués, donc compacts et à basse consommation tout en étant suffisamment rapides et performants en terme de détection.Ainsi, l’état de l’art donne des exemples d’optimisation de systèmes embarqués et intégrés pour la détection des objets. Par exemple, des travaux sur le sujet ont cherché à diminuer la précision des calculs, et ainsi la consommation, vers une valeur aussi minimale que possible. D’autres ont diminué la résolution d’image (et/ou la taille) par une codification par pixel en moins de bits. De plus, cette stratégie a bénéficié d’étapes du prétraitement pour augmenter la robustesse lors de la compression et minimiser la perte d’information. Parmi les types de prétraitement, nous pouvons trouver ceux qui n’ont pas besoin d’être programmables, qui ont aussi l’avantage potentiel d’être plus simples que, par exemple, des algorithmes qui ont besoin d’accès aux « poids » d’un réseau de neurones à convolution. Une autre stratégie a été de réduire la quantité de données transitant entre différents circuits, grâce à une intégration plus poussée d’algorithmes spécifiques de traitement d’image dans une même puce.Dans ce contexte de calcul proche capteur, cette thèse a comme objectif l’étude d’un type de prétraitement d’image et d’une architecture dédiée pour minimiser la consommation d’énergie pour des performances de localisation et de classification similaires à l’état de l’art. Nos objectifs principaux sont :1. Etudier l’intégration d’un algorithme d’extraction des gradients orientés pour la génération de régions proposées (inspiré par l’algorithme « EdgeBoxes ») qui ne dépend pas du type d’objet à détecter.2. Concevoir, au niveau système, une architecture de circuit mixte pour l’extraction des gradients orientés compressés. Cette architecture sera dédiée à la minimisation de la consommation, avec une complexité acceptable, tout en étant optimisée pour les étapes suivantes de génération des régions proposées.3. Finalement, étudier la viabilité d’application de systèmes d’imagerie non classiques (dit neuro-morphiques) pour augmenter l’efficacité de génération des régions proposés à basse puissance.La méthodologie proposée se base sur des simulations comportementales avec un environnement développé en Python et C++. Un modèle hiérarchique permettant de simuler différents systèmes de vision (classiques ou non) a été développé, avec ou sans prétraitement intégré proche capteur. Nous utilisons cet environnement pour obtenir des métriques liées à l’architecture de prétraitement, ou au performance des étapes de détection suivantes, tels que le temps d’exécution, l’utilisation de la mémoire, la complexité matérielle, la quantité des données générées, la performance de localisation et la performance de classification. Finalement, les résultats en performance ainsi que des comparaisons entre l’état de l’art et différentes versions de notre architecture sont présentés et discutés.