Thèse soutenue

Stratégies statistiques exploitant les données de la population générale pour aider au diagnostic des maladies rares

FR  |  
EN
Auteur / Autrice : Marie-Sophie Ogloblinsky
Direction : Emmanuelle Génin
Type : Thèse de doctorat
Discipline(s) : Génétique, génomique, bioinformatique
Date : Soutenance le 28/06/2024
Etablissement(s) : Brest
Ecole(s) doctorale(s) : École doctorale Sciences de la Vie et de la Santé (Rennes ; 2022-....)
Partenaire(s) de recherche : Laboratoire : Génétique, génomique fonctionnelle et biotechnologies (Brest, Finistère)
Jury : Président / Présidente : Gérald Le Gac
Examinateurs / Examinatrices : Emmanuelle Génin, Gérald Le Gac, Antonio Rausell, Aurélie Cobat, Gaëlle Marenne, Donald Conrad, Marie de Tayrac, Gaël Nicolas
Rapporteurs / Rapporteuses : Antonio Rausell, Aurélie Cobat

Résumé

FR  |  
EN

La forte hétérogénéité génétique et les modes de transmission complexes des maladies rares posent le défi d'identifier le variant causal si un seul patient le porte, en utilisant des données de séquençage et des méthodes d'analyse standard. Pour aborder ce problème, la méthode PSAP utilise des distributions nulles par gène de scores de pathogénicité CADD pour évaluer la probabilité d'observer un génotype donné dans la population générale. L'objectif de ce travail était de répondre au manque de diagnostic des maladies rares grâce à des méthodes statistiques. Nous proposons PSAP-genomic-regions, une extension de la méthode PSAP au génome non codant, en utilisant comme unités de test des régions prédéfinies reflétant la contrainte fonctionnelle à l'échelle du génome entier. Nous avons implémenté PSAP-genomic regions et sa version initiale PSAP-genes dans Easy-PSAP, un workflow Snakemake intuitif et adaptable, accessible aussi bien aux chercheurs qu'aux cliniciens. Appliqué à des familles touchées par de l'infertilité masculine, Easy-PSAP a permis la priorisation de variants candidats pertinents dans des gènes connus et nouveaux. Nous nous sommes ensuite concentrés sur le digénisme, le mode le plus simple de transmission complexe, qui implique l'altération simultanée de deux gènes pour développer une maladie. Nous avons décrit et évalué les méthodes actuelles publiées dans la littérature pour détecter le digénisme et proposé de nouvelles stratégies pour améliorer le diagnostic de ce mode de transmission complexe.