Optimisation de l’analyse de données génomiques dans les maladies rares
Auteur / Autrice : | Anne-Sophie Denommé-Pichon |
Direction : | Laurence Olivier-Faivre, Antonio Vitobello, Yannis Duffourd |
Type : | Thèse de doctorat |
Discipline(s) : | Médecine, cancérologie, génétique, hématologie, immunologie |
Date : | Soutenance le 05/05/2023 |
Etablissement(s) : | Bourgogne Franche-Comté |
Ecole(s) doctorale(s) : | École doctorale Environnements, Santé (Dijon ; Besançon ; 2012-....) |
Partenaire(s) de recherche : | Etablissement de préparation : Université de Bourgogne (1970-2024) |
Laboratoire : Centre de recherche Translationnelle en Médecine moléculaire (CTM) (Dijon) | |
: Centre hospitalier universitaire (Dijon) | |
Jury : | Président / Présidente : Christophe Philippe |
Examinateurs / Examinatrices : Estelle Colin | |
Rapporteurs / Rapporteuses : Jean Muller, Marie de Tayrac |
Mots clés
Résumé
Les analyses pangénomiques d’exome et de génome ont permis d’augmenter considérablement le rendement diagnostique des maladies rares d’origine génétique au cours des dernières années, mais plus de 50 % des patients restent en impasse diagnostique (Wright, FitzPatrick, et Firth 2018). Pour les patients qui bénéficient d’un diagnostic, le délai d’obtention reste long, dépassant 5 ans pour 25 % des patients (Ministère des Solidarités et de la Santé 2019). L’absence de diagnostic ou le délai avant celui-ci sont une réelle perte de chance pour le patient et les familles, en termes de prise en charge de soin, mais également en termes de prise en charge sociale.L’objectif de la thèse est d’optimiser l’analyse de données génomiques dans les maladies rares, par l’implémentation de nouvelles approches, qu’elles soient organisationnelles, biologiques ou bioinformatiques, en vue d’obtenir un diagnostic plus rapidement dans un contexte d’urgence, et d’augmenter le rendement diagnostique. La thèse est divisée en trois axes d’optimisation.Le premier axe, l’optimisation organisationnelle, consiste en l’étude Fastgen, qui évalue la faisabilité de l’analyse accélérée de génomes short read en trio chez des enfants en réanimation ou soins intensifs, nécessitant un diagnostic génétique précoce pour orienter leur prise en charge. L’objectif était d’obtenir un résultat en moins de 45 jours. Un séquençage de génomes en trio a été réalisé chez 37 familles, conduisant à un diagnostic moléculaire chez 18/37 (49 %) enfants, avec une durée médiane de rendu de résultat de 42 jours.Le deuxième axe, l’optimisation biologique, consiste en l’étude de la cohorte unsolved cases du projet Solve-RD, qui vise à réduire l’impasse diagnostique par la réanalyse de données d’exomes de patients sans diagnostic et par la mise à disposition des données génomiques aux équipes du projet. Les données de 3576 exomes (1522 cas index et 2054 parents) ont été réanalysées selon une stratégie low-hanging fruit qui vise à rechercher les variations déjà rapportées dans ClinVar comme étant pathogènes ou probablement pathogènes. La réanalyse a permis d’identifier les variations causales chez 59 patients (3,9 %), dont 9 pour lesquels nous présentons les raisons de l’absence de diagnostic au moment de la première analyse et les leçons à en tirer.Le partage des données au sein de Solve-RD a facilité la construction d’une cohorte qui a permis d’établir la responsabilité du gène YWHAE dans un trouble du neurodéveloppement avec ou sans anomalies cérébrales, ce qui a mené à un diagnostic chez 7 sujets avec des variations perte de fonction de ce gène.Le troisième axe, l’optimisation bioinformatique, consiste en l’implémentation d’un pipeline utilisant les meilleurs outils de génotypage d’expansions de microsatellites à partir de données de génome short read, dans le but d’établir de nouveaux diagnostics. Nous avons évalué les 10 principaux outils de la littérature, en avons conservé 4 et les avons testés sur 23 locus impliqués en pathologie humaine sur notre cohorte de 323 génomes de sujets atteints de troubles du neurodéveloppement. Le pipeline développé a mené à l’identification d’une expansion de microsatellites pathologique pouvant prédisposer à une maladie neurodégénérative, considérée comme une donnée incidente car sans lien avec le phénotype du patient.Notre stratégie d’optimisation de l’analyse des données génomiques dans les maladies rares s’avère efficace : elle a permis de réduire l’errance diagnostique chez des enfants dans un contexte d’urgence et d’augmenter le rendement diagnostique du séquençage de l’exome et du génome short read par le développement de nouvelles stratégies d’analyse, de réanalyse et par le partage de données à large échelle.