Analyse intégrative de données multi-omiques pour la priorisation de variants génomiques
Auteur / Autrice : | Jędrzej Kubica |
Direction : | Nicolas Thierry-Mieg, Sébastien Dejean |
Type : | Projet de thèse |
Discipline(s) : | MBS - Modèles, méthodes et algorithmes en biologie, santé et environnement |
Date : | Inscription en doctorat le 01/09/2024 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Translational Innovation in Medicine and Complexity |
Equipe de recherche : MAGe - Modèles et Algorithmes pour la Génomique |
Mots clés
Résumé
Objectifs : Le but de ce projet de doctorat est de développer une méthode d'analyse intégrative multi-omique pour évaluer les variants génomiques dérivés de l'exome-seq et du genome-seq en fonction de la probabilité qu'elles soient à l'origine du phénotype ou de la maladie d'un patient. Méthodes : Un réseau multi-omique humain de qualité contrôlée sera assemblé, sur la base des données d'interactome des membres du consortium IMEx et de BioGrid, des données d'expression du consortium Genotype-Tissue Expression (GTEx), et d'autres couches d'informations biologiques telles que la co-occurrence dans les voies voies biologiques ou la corégulation par des microARNs ou des facteurs de transcription partagés. Sur la base d'analyses topologiques du réseau multiomique, de nouvelles méthodes permettant de quantifier la 'distance' de chaque nud à un sous-ensemble de gènes connus pour être associés à la maladie seront mises au point, en s'inspirant de mesures appropriées de centralité de graphes. Dans une approche complémentaire, ce réseau pourra être analysé pour identifier des modules fonctionnels, en utilisant et en adaptant des méthodes de pointe, notamment des algorithmes de kernel clustering ou d'optimisation de la modularité. Ces composantes dérivées du réseau multi-omique seront intégrées aux données déjà disponibles sur les variants et les gènes, et des méthodes d'apprentissage automatique supervisé seront appliquées pour obtenir un score intégratif unique permettant de classer les variants candidats par ordre de priorité. Données/Application : le développement de la méthode et la validation du concept s'appuieront sur un ensemble de données, disponible en interne, de séquençage d'exomes pour une cohorte d'environ 1100 patients souffrant de diverses formes d'infertilité, dont 226 pour lesquels l'étiologie génétique est connue à ce jour. Résultats attendus : des méthodes nouvelles et améliorées pour hiérarchiser les variantes génomiques dans les maladies génétiques, en s'appuyant sur l'analyse intégrative de données multi-omiques. Ces méthodes pourraient être mises en uvre sous la forme d'un plugin Ensembl Variant Effect Predictor (VEP), pour une meilleure visibilité. Le doctorant fera partie du réseau doctoral du projet M4DI, l'un des axes du PEPR Santé Numérique. A ce titre, un séjour de recherche d'environ 4 mois dans le laboratoire secondaire (IMT Toulouse) est prévu. Le doctorant aura également la possibilité de participer à des 'data challenge' M4DI, et de collaborer avec d'autres axes du PEPR Santé Numérique.