Thèse soutenue

Méthodes de gestion des données manquantes en épidémiologie. : Application en cancérologie

FR  |  
EN
Auteur / Autrice : Noémie Resseguier
Direction : Roch Giorgi
Type : Thèse de doctorat
Discipline(s) : Pathologie humaine. Recherche clinique et santé publique
Date : Soutenance le 04/12/2013
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : École Doctorale Sciences de la Vie et de la Santé (Marseille)
Partenaire(s) de recherche : Laboratoire : Sciences économiques et sociales de la santé & traitement de l’information médicale (Marseille)
Jury : Président / Présidente : Nicolas Molinari
Examinateurs / Examinatrices : Roch Giorgi, Bruno Falissard, Bernard Asselain, Claire Julian-Reynier, Lionel Dany
Rapporteur / Rapporteuse : Bruno Falissard, Bernard Asselain

Résumé

FR  |  
EN

La problématique de la gestion des données manquantes dans les études épidémiologiques est un sujet qui intéressera tous les chercheurs impliqués dans l’analyse des données recueillies et dans l’interprétation des résultats issus de ces analyses. Et même si la question de la gestion des données manquantes et de leur impact sur la validité des résultats obtenus est souvent discutée, cesont souvent les méthodes de traitement des données manquantes les plus simples mais pas toujours les plus valides qui sont utilisées en pratique. L’utilisation de chacune de ces méthodes suppose un certain nombre d’hypothèses sous lesquelles les résultats obtenus sont valides, mais il n’est pas toujours possible de tester ces hypothèses. L’objectif de ce travail était (i) de proposer une revue des différentes méthodes de traitement des données manquantes utilisées en épidémiologie en discutant les avantages et les limites de chacune de ces méthodes, (ii) de proposer une stratégie d’analyse afin d’étudier la robustesse des résultats obtenues via les méthodes classiques de traitement des données manquantes à l’écart aux hypothèses qui, bien que non testables, sont nécessaires à la validité de ces résultats, et (iii) de proposer quelques applications sur des données réelles des différents point discutés dans les deux premières parties.