Réseaux bayésiens et analyse de survie pour l’estimation de courbes de pénétrance du cancer broncho-pulmonaire lié à des prédispositions génétiques
Auteur / Autrice : | Lucas Ducrot |
Direction : | Grégory Nuel, Patrick Benusiglio |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques |
Date : | Soutenance le 13/05/2024 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de probabilités, statistique et modélisation (Paris ; 2018-....) |
Jury : | Président / Présidente : Christophe Ambroise |
Examinateurs / Examinatrices : Maud Thomas, Camille Charbonnier | |
Rapporteur / Rapporteuse : Agathe Guilloux, Catherine Legrand |
Résumé
Cette thèse se concentre sur l'estimation de courbes de pénétrance de maladies génétiques à partir de données de pédigrée, avec un intérêt particulier pour la prédisposition génétique au cancer broncho-pulmonaire. Dans ce contexte, elle vise à proposer des résultats à la fois cliniques et épidémiologiques ainsi que des résultats méthodologiques.Les consultations en génétique sont proposées aux patients ayant des antécédents familiaux sévères de maladies génétiques. Les médecins généticiens doivent sélectionner, parmi ces patients, lesquels se voient proposer un test génétique, ainsi qu'évaluer les risques de maladie pour ces patients et leurs familles. La progression des connaissances en génétique est rapide et le nombre de variants pathogènes identifiés pour différentes maladies augmentent chaque année. Cela entraine un besoin d'outils de prédiction et d'évaluation de risque important, en particulier dans le cadre du cancer broncho-pulmonaire. En effet, les liens entre ce dernier et des variants pathogènes (SFTPA1/SFTPA2 et sur les gènes TP53 et EGFR) sont connus mais encore peu décrits.Les méthodes existantes pour évaluer le risque de survenue de maladies reposent sur les courbes de pénétrance, mais leur estimation présente des défis en raison du faible nombre de patients et du biais de sélection omniprésent dans les jeux de données collectés en génétique. Pour surmonter ces obstacles, la thèse explore l'utilisation de données familiales, en utilisant un ensemble d'outils statistiques dont les réseaux bayésiens, les modèles de mélange et l'analyse de survie, ainsi que des modèles existants, pour lesquels elle tente d'affaiblir certaines hypothèses.Le chapitre 1 propose une présentation du contexte médical de la thèse, introduisant les notions de maladies génétiques et de conseil en génétique. Le chapitre 2 est une introduction méthodologique présentant, et illustrant sur des exemples, les concepts d'analyse de survie, de réseaux bayésiens, d'algorithme somme-produit, de modèles de mélanges et d'algorithme EM. Il propose également un état de l'art de l'estimation de courbe de pénétrance pour des maladies génétiques et une mise en évidence du biais de sélection en génétiques. Il se conclue par un récapitulatif des questions de recherche abordées.Cette thèse s'est, ensuite, orientée autour de quatre projets. Les deux premiers projets, correspondant aux chapitres 3 et 4, proposent des résultats plutôt cliniques et épidémiologiques. La premier projet, décrit au chapitre 3, porte sur une comparaison de différentes méthodes de prédiction de variants pathogènes pour les cancers sein/ovaire (Score de Manchester et modèles familiaux, type BOADICEA). Le second projet, abordé au chapitre 4, propose une estimation des pénétrances de la pneumopathie interstitielle et du cancer broncho-pulmonaire pour les porteurs de variants pathogènes SFTPA1 et SFTPA2.Les deux derniers projets, correspondant aux chapitres 5 et 6, sont plus méthodologiques. Le chapitre 5 est consacré au développement d'une nouvelle méthode d'estimation de courbe de pénétrance de maladie génétique à partir de données de pédigrée lorsque la maladie présente des cas sporadiques. Elle se base sur une contrainte d'incidence de la maladie en population générale et une paramétrisation du ratio de risques instantanés entre les porteurs et les non-porteurs de variants pathogènes. Le chapitre 6 se consacre, lui, à la mise en évidence du biais introduit par la sélection en génétique et ses conséquences sur les résultats de la méthode développée au chapitre 5. Des méthodes de corrections connues, comme la Proband's phenotype Exclusion Likelihood (PEL) et la Genotype-Restricted Likelihood (GRL), combinées à notre méthode, sont appliquées à des données simulées.