Thèse soutenue

Apprentissage profond et géométrie de l'information pour la classification de signaux temporels

FR  |  
EN
Auteur / Autrice : Daniel Brooks
Direction : Matthieu CordOlivier Schwander
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 03/07/2020
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche : Laboratoire : LIP6 (1997-....)
Jury : Président / Présidente : Yannick Berthoumieu
Examinateurs / Examinatrices : Frédéric Barbaresco, Hichem Sahbi
Rapporteurs / Rapporteuses : Marco Congedo, Florence Tupin

Résumé

FR  |  
EN

L’apprentissage automatique, et en particulier l’apprentissage profond, unit un arsenal d’outillages puissants pour modeler et étudier les distributions statistiques sous-jacentes aux données, permettant ainsi l’extraction d’informations sémantiquement valides et interprétables depuis des séquences tabulaires de nombres par ailleurs indigestes à l’œil humain. Bien que l’apprentissage fournisse une solution générique à la plupart des problèmes, certains types de données présentent une riche structure issue de phénomènes physiques: les images ont la localité spatiale, les sons la séquentialité temporelle, le radar la structure temps-fréquence. Il est à la fois intuitif et démontrable qu’il serait bénéfique d’exploiter avec astucieuse ces formations fondatrices au sein même des modèles d’apprentissage. A l’instar des architectures convolutives pour les images, les propriétés du signal peuvent être encodées et utilisées dans un réseau de neurones adapté, avec pour but l’apprentissage de modèles plus efficaces, plus performants. Spécifiquement, nous œuvrerons à intégrer dans la conception nos modèles profonds pour la classification de séries temporelles des sur leurs structures sous-jacentes, à savoir le temps, la fréquence, et leur nature proprement complexe. En allant plus loin dans une veine similaire, l’on peut s’atteler à la tâche d’étudier non pas le signal en tant que tel, mais bel et bien la distribution statistique dont il est issu. Dans ce scénario, les familles Gaussiennes constituent un candidat de choix. Formellement, la covariance des vecteurs de données caractérisent entièrement une telle distribution, pour peu qu’on la considère, à peu de frais, centrée; le développement d’algorithmes d’apprentissage, notamment profonds, sur des matrices de covariance, sera ainsi un thème central de cette thèse. L’espace des distributions diverge de manière fondamentale des espaces Euclidiens plats; il s’agit en fait de variétés Riemanniennes courbes, desquelles il conviendra de respecter la géométrie mathématique intrinsèque. Spécifiquement, nous contribuons à des architectures existantes par la création de nouvelles couches inspirées de la géométrie de l’information, notamment une couche de projection sensible aux données, et une couche inspirée de l’algorithme classique de la Batch Normalization. La validation empirique de nos nouveaux modèles se fera dans trois domaines différents: la reconnaissance d’émotions par vidéo, d’action par squelettes, avec une attention toute particulière à la classification de drones par signal radar micro-Doppler. Enfin, nous proposerons une librairie PyTorch aidant à la reproduction des résultats et la facilité de ré-implémentationdes algorithmes proposés.