Stratégies statistiques exploitant les données de la population générale pour aider au diagnostic des maladies rares
Auteur / Autrice : | Marie-Sophie Ogloblinsky |
Direction : | Emmanuelle Génin |
Type : | Thèse de doctorat |
Discipline(s) : | Génétique, génomique, bioinformatique |
Date : | Soutenance le 28/06/2024 |
Etablissement(s) : | Brest |
Ecole(s) doctorale(s) : | École doctorale Sciences de la Vie et de la Santé (Rennes ; 2022-....) |
Partenaire(s) de recherche : | Laboratoire : Génétique, génomique fonctionnelle et biotechnologies (Brest, Finistère) |
Jury : | Président / Présidente : Gérald Le Gac |
Examinateurs / Examinatrices : Emmanuelle Génin, Gérald Le Gac, Antonio Rausell, Aurélie Cobat, Gaëlle Marenne, Donald Conrad, Marie de Tayrac, Gaël Nicolas | |
Rapporteurs / Rapporteuses : Antonio Rausell, Aurélie Cobat |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
La forte hétérogénéité génétique et les modes de transmission complexes des maladies rares posent le défi d'identifier le variant causal si un seul patient le porte, en utilisant des données de séquençage et des méthodes d'analyse standard. Pour aborder ce problème, la méthode PSAP utilise des distributions nulles par gène de scores de pathogénicité CADD pour évaluer la probabilité d'observer un génotype donné dans la population générale. L'objectif de ce travail était de répondre au manque de diagnostic des maladies rares grâce à des méthodes statistiques. Nous proposons PSAP-genomic-regions, une extension de la méthode PSAP au génome non codant, en utilisant comme unités de test des régions prédéfinies reflétant la contrainte fonctionnelle à l'échelle du génome entier. Nous avons implémenté PSAP-genomic regions et sa version initiale PSAP-genes dans Easy-PSAP, un workflow Snakemake intuitif et adaptable, accessible aussi bien aux chercheurs qu'aux cliniciens. Appliqué à des familles touchées par de l'infertilité masculine, Easy-PSAP a permis la priorisation de variants candidats pertinents dans des gènes connus et nouveaux. Nous nous sommes ensuite concentrés sur le digénisme, le mode le plus simple de transmission complexe, qui implique l'altération simultanée de deux gènes pour développer une maladie. Nous avons décrit et évalué les méthodes actuelles publiées dans la littérature pour détecter le digénisme et proposé de nouvelles stratégies pour améliorer le diagnostic de ce mode de transmission complexe.