Thèse soutenue

FR
Auteur / Autrice : Thi Khuyen Le
Direction : Frédéric RichardCaroline Chaux
Type : Thèse de doctorat
Discipline(s) : Mathématiques. Statistiques
Date : Soutenance le 08/06/2020
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : Ecole doctorale Mathématiques et Informatique de Marseille (Marseille ; 1994-....)
Partenaire(s) de recherche : Laboratoire : Institut de mathématiques de Marseille (I2M)
Jury : Président / Présidente : Sophie Achard
Examinateurs / Examinatrices : Eric Guedj, Pierre Pudlo
Rapporteurs / Rapporteuses : Jérémie Bigot, Florence Forbes

Résumé

FR  |  
EN

Notre recherche exploite deux caractéristiques principales du modèle GLASSO: la parcimonie et la monotonie. En se basant sur la parcimonie de ce modèle, nous proposons d'adapter la méthode d'analyse discriminante linéaire (ADL) en grande dimension, en incorporant une estimation parcimonieuse de la matrice de précision sur l'ensemble de la population. Afin d'améliorer la performance de cette méthode, nous proposons de réduire la dimension de données en sélectionnant des composantes connexes plus discriminantes. Cette sélection est basée sur une forme spéciale de la matrice de précision qui est diagonale par blocs. En particulier, chaque bloc est correspondant à une composante connexe dans le modèle GLASSO. En se basant sur la méthode d'analyse discriminante factorielle, nous définissons la capacité discriminante de chaque composante. Ensuite, la sélection est restreinte uniquement sur les variables dans les composantes dont les capacités discriminantes sont plus grandes. Tous ces méthodes sont appliquées sur les données réelles issues de l'imagerie cérébrale tomographie pour la classification de certains groupes de patients atteints comme fibromyalgie, dépression, ou de la maladie d'Alzheimer. Par ailleurs, en se basant sur la monotonie du modèle GLASSO, nous proposons un test de la signification des composantes sur des modèles d'intersection et d'union de GLASSO. Ces tests nous permettent de déterminer le modèle le plus parcimonieux qui contient toutes les composantes connexes du vrai modèle. En particulier, ces tests convergent sur des lois exponentielles avec des nombres raisonnables de variables et d’observations