Thèse soutenue

Exploration multimodale du séquençage de génome humain pour résoudre l'impasse diagnostique de maladies rares

FR  |  
EN
Auteur / Autrice : Kévin Yauy
Direction : Julien Thévenon
Type : Thèse de doctorat
Discipline(s) : Biologie du développement oncogenèse
Date : Soutenance le 29/09/2022
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale chimie et science du vivant (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Institut pour l'avancée des biosciences (Grenoble)
Jury : Président / Présidente : Pierre Ray
Examinateurs / Examinatrices : Jean-Baptiste Rivière, Laurence Olivier-Faivre, Jérôme Govin, Damien Sanlaville
Rapporteur / Rapporteuse : Alexandre Reymond, Peter Krawitz

Résumé

FR  |  
EN

Les maladies rares sont individuellement rares mais collectivement fréquentes. Plus de 7% des adultes sont affectés dans le monde par l'une des 6000 maladies actuellement décrites. 72 % des maladies rares sont d'origine génétique. Depuis l’apparition du séquençage de nouvelle génération, le diagnostic des maladies rares n'est plus limité par le séquençage en lui-même mais l'analyse des données générées par le séquençage. Malgré l'accessibilité en routine clinique du séquençage du génome, la majorité des patients souffrant de maladies rares restent sans diagnostic. Mon projet de thèse visait à résoudre des défis actuels dans l'analyse du séquençage pour améliorer le diagnostic des maladies rares. Ce manuscrit est axé sur deux principaux projets que j'ai menés au cours de ce doctorat avec l'équipe de SeqOne Genomics et le CHU Grenoble Alpes.Premièrement, je me suis attaqué au problème de la réinterprétation des données de séquençage de patients restés sans diagnostic. Cette étape de réinterprétation est manuelle, et le manque de ressources humaines la rend difficile à réaliser en routine. Nous avons développé Genome Alert!, une méthode automatisée et libre qui monitore les changements dans la base de données de partage d'interprétation des variants ClinVar. Ce monitoring permet de réévaluer mensuellement et automatiquement la pathogénicité des variants et les gènes impliqués en maladies humaines. La réinterprétation de 4 929 analyses avec cette méthode a révélé 45 changements ayant un impact clinique potentiel et a conduit à quatre diagnostics supplémentaires. Ce travail représente la première validation à grande échelle d'un système automatisé de réinterprétation des données de séquençage qui pourrait devenir un standard en médecine génomique.En seconde partie, j'ai exploré le défi de la numérisation des données cliniques, avec pour objectif d’améliorer l’utilisation du phénotypage (ou codage médical) des cliniciens dans l'analyse génomique. Nous rapportons la première étude axée sur les pratiques de phénotypage, en analysant 1 686 descriptions de patients provenant de quatre groupes internationaux. Malgré l'adoption d'une norme commune appelée Human Phenotype Ontology, nous avons constaté une approche très hétérogène du phénotypage en ce qui concerne le nombre et le choix des symptômes, et ce même pour les mêmes patients. Cette description fluctuante est un défi majeur qui doit être surmonté pour nous permettre d'exploiter les données cliniques des dossiers médicaux. En effet, moins de la moitié (43%) des associations symptôme-gène déclarées dans la cohorte étaient retrouvées dans les bases de données publiques. Dans le but de modéliser ce raisonnement médical inductif qui pourrait expliquer l'hétérogénéité du phénotypage entre les observations cliniques, nous avons développé des méthodes basées sur l'association conjointe de symptômes au sein des maladies génétiques.À l'aide d'algorithmes graphes, nous avons entraîné un modèle d'interaction des symptômes en maladies génétiques qui projette les descriptions cliniques en format HPO (16,600 symptômes) dans la dimension des symptômes en interaction contenant 390 groupes et 1 131 886 paires de symptômes. Pour évaluer la pertinence clinique de ce modèle, nous l’avons utilisé comme système de priorisation de gènes en fonction du phénotype et avons amélioré les performances de priorisation de 42 % par rapport au meilleur concurrent actuel. Ce modèle devrait permettre de nouvelles découvertes en médecine de précision par sa capacité à exploiter des descriptions cliniques hétérogènes.Au travers ce travail de thèse, j'espère avoir réussi à apporter ma pierre à l'édifice pour sensibiliser à la médecine génomique dans la communauté médicale et fournir des solutions techniques pour améliorer la prise en charge des patients atteints de maladies rares.