Thèse soutenue

Contribution à la statistique en grande dimension et son application au traitement de données biomédicales

FR  |  
EN
Auteur / Autrice : Firas Ibrahim
Direction : Mustapha RachdiJacques Demongeot
Type : Thèse de doctorat
Discipline(s) : Modèles, méthodes et algorithmes en biologie, sante et environnemen
Date : Soutenance le 16/12/2020
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Autonomie, Gérontologie, E-santé, Imagerie & Société (Grenoble)
Jury : Président / Présidente : José Labarère
Examinateurs / Examinatrices : Mustapha Rachdi, Jacques Demongeot, Elias Ould-Saïd
Rapporteurs / Rapporteuses : Salim Bouzebda, Sophie Dabo-Niang

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Dans cette thèse, on traite le problème de l'estimation non paramétrique de la régression d'une variable de réponse scalaire incomplète, mais ayant des valeurs de substitution (surrogate data), à partir d'une variable aléatoire fonctionnelle. Nous avons commencé à construire un estimateur de l'opérateur de régression en remplaçant les réponses manquantes par les données de substitution. Nous avons établi ensuite des propriétés asymptotiques de l’estimateur construit, en termes de convergence en probabilité, presque complète et en moyenne quadratique. Puis, nous avons appliqué les résultats obtenus sur des données simulées, puis sur des données réelles.Ensuite, nous avons étudié l’estimation du modèle linéaire fonctionnel, lorsque certaines observations de la réponse réelle ne sont pas disponibles. Dans ce cas, la réponse est aussi un scalaire, dont nous remplaçons les valeurs manquantes par des données de substitution, et le prédicteur est fonctionnel. Nous avons construit l'estimateur de l'opérateur de régression, puis nous avons prouvé la convergence presque complète et la convergence en probabilité. A l'issue de cette partie, nous avons conduit des simulations, permettant de rendre compte de l’efficacité du procédé proposé, puis nous avons appliqué notre méthodologie sur des données réelles (signaux respiratoires).Dans le dernière partie de cette thèse, une application utilisant des données de substitution de données médicales, a permis de prédire la PaO2, à partir du taux respiratoire à l'admission. De plus, nous avons procédé à une comparaison des estimations, quand (i) les observations sont totalement complètes, (ii) à partir de données avec valeurs d’imputation et enfin (iii) à partir des données de substitution.