Thèse soutenue

Reconnaissance d’évènement en imagerie thermique et de profondeur

FR  |  
EN
Auteur / Autrice : Adnan Salih Al Alwani
Direction : Youssef Chahir
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance en 2016
Etablissement(s) : Caen
Ecole(s) doctorale(s) : École doctorale structures, informations, matière et matériaux (Caen1992-2016)
Partenaire(s) de recherche : Laboratoire : Groupe de recherche en informatique, image, automatique et instrumentation de Caen (1995-....)
autre partenaire : Normandie Université (2015-....)
Jury : Président / Présidente : François Jouen
Examinateurs / Examinatrices : Youssef Chahir, François Jouen, Abdelmalik Taleb-Ahmed, Charles Tijus, Alain Bretto, Luigi Lancieri
Rapporteurs / Rapporteuses : Abdelmalik Taleb-Ahmed, Charles Tijus

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

On assiste depuis quelques temps `a un regain d’intérêt pour un certain nombre de problèmes liés au domaine de l’analyse de l’activité humaine `a partir de caméras et de capteurs 3D et ceci pour plusieurs raisons dont principalement le d´développement de la technologie d’estimation de profondeur de Kinect et les caméras Time-Of-Flight. En outre, le caractère complémentaire de la profondeur et de l’information visuelle (RGB) fournies par ces dispositifs offre de nouvelles solutions potentielles aux problèmes classiques de la vision par ordinateur. Par ailleurs, la thermographie infrarouge (IRT), aussi connu comme l’imagerie thermique, est une technologie idéale pour garantir des résultats de mesures non intrusives probants en toutes circonstances pour un nombre croissant d’applications de s´écrite et de surveillance comme pour le diagnostic m´médical. L’analyse thermique affine la reconnaissance visuelle. Cependant, d´détecter `a la volée un ´évènement remarquable qui se distingue par son comportement temporel, dans les s´séquences vidéo reste un d´défi majeure. Ce problème est particulièrement difficile en raison d’´énormes variations dans les aspects visuels et de mouvement des objets et de la caméra, des occlusions, ainsi que la présence de bruit. L’objectif principal de cette thèse est d’apporter des contributions m´méthodologiques pour la d´détection des ´évènements `a partir de flux issus de caméras thermique et de caméras de profondeur Kinect. La première partie de nos contributions concerne le d´développement d’une plateforme de reconnaissance d’´évènement thermique basée sur l’extraction de motifs spatio-temporels `a partir de s´séries chronologiques avec une application d´ediee au domaine m´médical. Nous nous sommes intéresses particulièrement `a la d´détection de la douleur chez les bébés prématurés et nous avons introduit une nouvelle base de données (Pretherm) réalisée dans le cadre du projet ANR du même nom, avec des vidéos de bébés prématurés de l’hôpital CHU de Caen. Pour caractériser le motif d’intérêt dans un signal monodimensionnel, nous avons proposé d’utiliser un descripteur basé sur les motifs binaires locaux non redondants (ou résiduels). Nous avons ´également d´défini une nouvelle m´méthode basée sur la persistance topologique pour filtrer et ordonner les valeurs critiques. Les deux m´méthodes ont ´et´e validés sur le corpus de s´séquences thermiques représentant la douleur et non douleur chez les enfants prématurés, grâce aux m´méthodes d’apprentissage statistique automatique suivants : Les réseaux de neurones (avec Extreme Learning Machines) et les m´méthodes a noyaux (avec Support Vector Machines). Dans la seconde partie de la thèse, nous avons ´étudie le problème de la reconnaissance automatique d’action humaine `a partir de caméras `a capteur de profondeur type Kinect. Nous nous sommes concentrés sur le d´développement de descripteurs spatio-temporels pertinents qui caractérisent au mieux l’action humaine et qui permettent de bien identifier la nature de l’action(classification). Nous passions en revue et comparions les techniques les plus populaires de l’´état de l’art pour la reconnaissance d’action. Dans un premier volet, nous nous sommes orient ´es vers l’analyse des angles des articulations et de leurs trajectoires. `a chaque angle d’articulation est associée une trajectoire au cours de l’action. La trajectoire d’une action donnée est ainsi d´décomposée en une suite de trajectoires ´élémentaires permettant la création d’un vocabulaire visuel compact et la construction d’un automate de reconnaissance d’actions modélise par un modèle de Markov caché (HMM). Pour pallier la sensibilité `a la rotation et aux variations locales des trajectoires, nous avons proposé une seconde approche basée sur les harmoniques sphériques (SHs). Ces derniers ´étant une description fréquentielle de l’image sphérique, le spectre est alors utilise comme descripteur, de structure de l’environnement dont la dimension est très faible, qui servira pour apprendre et reconnaitre les poses. Chaque catégorie est ainsi caractérisée par une distribution de probabilité de spectres d’harmoniques sphériques. Ensuite, pour améliorer la précision et la convergence des calculs, nous avons utilise une représentation compacte en utilisant les harmoniques sphériques sous une forme quadratique. Finalement, les techniques proposées permettent d’obtenir une performance meilleure ou semblable par rapport `a l’´etat de l’art, sur des bases de données représentant une grande diversité d’actions 3D (MSR Action 3D , UTKinect Action , Florence Action, et G3D).