Thèse soutenue

Statistiques spatiales dans les modèles à choix discrets, application aux cancers de l'UADT dans le nord de la France

FR  |  
EN
Auteur / Autrice : Emad Aldeen Darwich
Direction : Sophie Dabo-NiangJérôme Foncel
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées et applications des mathématiques
Date : Soutenance le 11/12/2017
Etablissement(s) : Lille 3
Ecole(s) doctorale(s) : École doctorale Sciences économiques, sociales, de l'aménagement et du management (Lille ; 1992-....)
Partenaire(s) de recherche : Laboratoire : LEM - Lille Économie Management
Jury : Président / Présidente : Ahmed El Ghini
Examinateurs / Examinatrices : Sophie Dabo-Niang, Jérôme Foncel, Ahmed El Ghini, Julie Le Gallo, Ghislain Geniaux, Olivier Torres
Rapporteur / Rapporteuse : Julie Le Gallo, Ghislain Geniaux

Résumé

FR  |  
EN

Ce mémoire de thèse concerne l’identification des facteurs de risque d’une maladie spécifique présentant une hétérogénéité spatiale au sein d’une région donnée. Plus particulièrement,nous nous sommes intéressés aux cancers des voies aéro-digestives supérieures(VADS) dans la région Nord-Pas-de-Calais (NPDC) en France. Pour cela, une étude cas témoins a d’abord été réalisée à partir de la création d’un échantillon d’individus sains qui n’étaient pas affectés par des tumeurs cancéreuses (les témoins) et d’un échantillon d’individus atteints du cancer (les cas - ou patients), recrutés dans les centres de soins dans le cadre des projets de recherche DEREDIA et NOFARIS. Concernant la méthodologie,des modèles binaires spatiaux répondant à l’objectif ont été développés à partir de travaux issus des domaines de recherche en statistique/économétrie des comportements(analyse des décisions) ainsi qu’en statistique spatiale. Un des apports méthodologiques de la thèse repose sur la combinaison de techniques provenant de ces deux champs de recherche. Dans une première partie, nous avons utilisé un modèle spatial binaire paramétrique contenant une variable spatiale latente de choix dans le cadre d’un échantillonnage des données. Ce problème est connu sous le nom de ''Choice-Based Sampling'' (CBS) dans les modèles discrets. Contrairement à l’échantillon aléatoire où tous les éléments de la population ont la même probabilité d’être choisi, l’échantillonnage CBS dans le modèle discret est un type d’échantillonnage dans lequel la classification de la population est faite sous forme de sous-ensembles (strates) basés sur des choix alternatifs. Dans ce contexte,l’utilisation de la procédure d’estimation par maximum de vraisemblance standard (MLE)dans le CBS pourrait mener à des estimations incohérentes (asymptotiquement biaisées).Nous avons adopté ainsi le principe du maximum de vraisemblance auprès de l’étude de scas-témoins spatiaux. Nous avons également fourni un estimateur des moments généralisés(GMM), basé sur les résidus généralisés. Dans une seconde partie, un modèle spatial binaire semi-paramétrique a été considéré. Nous présentons dans ces parties, une simulation de Monte Carlo pour étudier la performance des méthodes d’estimation au sein d’un échantillon final, que nous avons ensuite appliqué aux données du cancer VADS dans la région Nord-Pas-de-Calais. La troisième partie est consacrée à l’étude d’une fonction de risque spatiale en présence de données entachées d’erreurs. En effet, dans le cadre des données cas-témoins considérées, nous supposons que certaines données de type déclarative ne soient pas correctes. Une application de cette méthode à la cartographie du risque de développer un cancer VADS dans la région Nord-Pas-de-Calais a été étudiée. La dernière partie est consacrée à un modèle de durée spatial et son application aux données considérées.