Contribution à la statistique en grande dimension et son application au traitement de données biomédicales
Auteur / Autrice : | Firas Ibrahim |
Direction : | Mustapha Rachdi, Jacques Demongeot |
Type : | Thèse de doctorat |
Discipline(s) : | Modèles, méthodes et algorithmes en biologie, sante et environnemen |
Date : | Soutenance le 16/12/2020 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Autonomie, Gérontologie, E-santé, Imagerie & Société (Grenoble) |
Jury : | Président / Présidente : José Labarère |
Examinateurs / Examinatrices : Mustapha Rachdi, Jacques Demongeot, Elias Ould-Saïd | |
Rapporteurs / Rapporteuses : Salim Bouzebda, Sophie Dabo-Niang |
Mots clés
Mots clés contrôlés
Résumé
Dans cette thèse, on traite le problème de l'estimation non paramétrique de la régression d'une variable de réponse scalaire incomplète, mais ayant des valeurs de substitution (surrogate data), à partir d'une variable aléatoire fonctionnelle. Nous avons commencé à construire un estimateur de l'opérateur de régression en remplaçant les réponses manquantes par les données de substitution. Nous avons établi ensuite des propriétés asymptotiques de l’estimateur construit, en termes de convergence en probabilité, presque complète et en moyenne quadratique. Puis, nous avons appliqué les résultats obtenus sur des données simulées, puis sur des données réelles.Ensuite, nous avons étudié l’estimation du modèle linéaire fonctionnel, lorsque certaines observations de la réponse réelle ne sont pas disponibles. Dans ce cas, la réponse est aussi un scalaire, dont nous remplaçons les valeurs manquantes par des données de substitution, et le prédicteur est fonctionnel. Nous avons construit l'estimateur de l'opérateur de régression, puis nous avons prouvé la convergence presque complète et la convergence en probabilité. A l'issue de cette partie, nous avons conduit des simulations, permettant de rendre compte de l’efficacité du procédé proposé, puis nous avons appliqué notre méthodologie sur des données réelles (signaux respiratoires).Dans le dernière partie de cette thèse, une application utilisant des données de substitution de données médicales, a permis de prédire la PaO2, à partir du taux respiratoire à l'admission. De plus, nous avons procédé à une comparaison des estimations, quand (i) les observations sont totalement complètes, (ii) à partir de données avec valeurs d’imputation et enfin (iii) à partir des données de substitution.