Thèse soutenue

Méthodes d'apprentissage et d'évaluation de graphes à partir de données structurées spatialement : application aux réseaux de connectivité fonctionnelle cérébrale

FR  |  
EN
Auteur / Autrice : Hanâ Lbath
Direction : Sophie Achard
Type : Thèse de doctorat
Discipline(s) : Mathématiques et informatique
Date : Soutenance le 25/09/2023
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Jean Kuntzmann (Grenoble)
Equipe de recherche : Equipe-projet Modelling and inference of complex and structured stochastic systems (Montbonnot, Isère, France ; 200.-2020)
: Agence nationale de la recherche (France)
Jury : Président / Présidente : Clémentine Prieur
Examinateurs / Examinatrices : Sarah Elizabeth Morgan
Rapporteurs / Rapporteuses : Nathalie Peyrard, Daniel Margulies

Résumé

FR  |  
EN

L'objectif principal de cette thèse est de développer des méthodes d'estimation statistiquement consistantes et d'analyse de graphes à partir de données multivariées telles que celles observées en neuroimagerie. Plus précisément, nous visons à mieux prendre en compte les dépendances spatiales des signaux ainsi que les incertitudes liées à l'acquisition des données et à la modélisation, qui sont connues pour entraver l'inférence de réseaux et les analyses en aval. La plupart des contributions présentées dans cette thèse pourraient être appliquées à des données groupées multivariées génériques. Bien que ces données soient présentes dans un large éventail de domaines, de l'économétrie aux études familiales, en passant par la météorologie, nous sommes motivés en particulier par une application à la connectivité fonctionnelle cérébrale. Dans ce contexte, les réseaux sont souvent construits à partir de données d'imagerie par résonance magnétique fonctionnelle (IRMf). Les nœuds correspondent alors à des régions cérébrales prédéfinies, contenant des voxels associés à des séries temporelles, et les arêtes relient couramment des régions corrélées.Nous proposons tout d'abord une approche basée sur le criblage en grande dimension de corrélations pour l'inférence de graphes binaires, et en particulier l’étape de seuillage, en présence de dépendance spatiale arbitraire. Dans certains contextes, les réseaux pondérés peuvent être préférés à leurs équivalents binaires. Nous contribuons donc à une étude qui exploite à la fois l'analyse topologique de données et des informations spatiales pour améliorer la discriminabilité de graphes pondérés. Nous nous attaquons ensuite au défi de l'estimation consistante du poids des arêtes et introduisons un estimateur de corrélation inter-régionale basé sur des techniques de clustering. Ce dernier compense simultanément les effets du bruit et de dépendances spatiales arbitraires. Enfin, au lieu de considérer des estimations ponctuelles, comme c'est généralement le cas dans la littérature, nous proposons plutôt de considérer des densités de corrélations comme phénotypes de connectivité à l’échelle des individus et de construire des réseaux pondérés par des fonctions de distribution. Nous évaluons alors leur répétabilité et mesurons leurs performances sur des tâches courantes d'apprentissage automatique avant de mettre en évidence les effets d'une forte variabilité inter-sujets. Le paradigme proposé, basé sur l’utilisation de distributions, introduit les bases pour la définition d'un cadre qui pourrait évaluer et prendre en compte l'incertitude dans l'estimation de réseaux de connectivité.Tout au long de cette thèse, nous évaluons et validons nos méthodes sur des données synthétiques ainsi que des données d’IRMf cérébrales réelles.