Développement de nouvelles méthodes statistiques pour l'analyse de données longitudinales multiblocs et tensorielles
Auteur / Autrice : | Lucas Sort |
Direction : | Arthur Tenenhaus |
Type : | Projet de thèse |
Discipline(s) : | Informatique mathématique |
Date : | Inscription en doctorat le 01/10/2021 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication |
Partenaire(s) de recherche : | Laboratoire : Laboratoire des Signaux et Systèmes |
Equipe de recherche : Signaux | |
Référent : Faculté des sciences d'Orsay |
Mots clés
Résumé
En recherche médicale, les données sont devenues de plus en plus complexes au cours des dernières décennies. En effet, les données sont désormais souvent observées à différentes occasions au cours du temps pour permettre un meilleur suivi de l'évolution des processus biologiques ayant un intérêt d'ordre médical. Dans ce contexte, ces données, souvent nommées données longitudinales, possèdent fréquemment une structure complexe de dimension élevée. Par exemple, dans un nombre croissant de situations, les données peuvent être structurées en un tableau multidimensionnel, également appelé tenseur. De la même façon, il arrive que les données puissent être organisées en plusieurs blocs, particulièrement dans le contexte multimodal. L'analyse statistique de telles structures de données pose divers problèmes méthodologiques. L'intégration de la structure tensorielle ou multibloc des données ou la considération des propriétés liées a l'aspect longitudinale apparaissent comme essentielles pour produire une analyse précise et significative des données. Dans ce contexte, nous suggérons d'utiliser le cadre méthodologique de l'analyse de données fonctionnelles afin étendre plusieurs approches issues du domaine de la statistique multivariée au cadre longitudinal. Premièrement, nous proposons d'étendre le cadre de travail de l'analyse multibloc fourni par l'Analyse Canonique des Corrélations Généralisée et Régularisée pour permettre aux chercheurs d'établir et d'étudier les associations entre plusieurs marqueurs longitudinaux. Ensuite, dans le cadre tensoriel, nous introduisons un nouveau modèle de décomposition tensorielle permettant d'extraire les informations les plus pertinentes de tenseurs de dimension élevée observés de façon longitudinale. Finalement, nous proposons un nouveau modèle pour la régression d'une réponse scalaire à partir de tenseurs longitudinaux. Diverses applications sont considérées afin d'illustrer les différents scénarios selon lesquels ces développements méthodologiques peuvent être utilisés pour assister la recherche médicale.