Thèse en cours

Analyse intégrative de données multi-omiques pour la priorisation de variants génomiques

FR  |  
EN
Auteur / Autrice : Jędrzej Kubica
Direction : Nicolas Thierry-MiegSébastien Dejean
Type : Projet de thèse
Discipline(s) : MBS - Modèles, méthodes et algorithmes en biologie, santé et environnement
Date : Inscription en doctorat le 01/09/2024
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Translational Innovation in Medicine and Complexity
Equipe de recherche : MAGe - Modèles et Algorithmes pour la Génomique

Résumé

FR  |  
EN

Objectifs : Le but de ce projet de doctorat est de développer une méthode d'analyse intégrative multi-omique pour évaluer les variants génomiques dérivés de l'exome-seq et du genome-seq en fonction de la probabilité qu'elles soient à l'origine du phénotype ou de la maladie d'un patient. Méthodes : Un réseau multi-omique humain de qualité contrôlée sera assemblé, sur la base des données d'interactome des membres du consortium IMEx et de BioGrid, des données d'expression du consortium Genotype-Tissue Expression (GTEx), et d'autres couches d'informations biologiques telles que la co-occurrence dans les voies voies biologiques ou la corégulation par des microARNs ou des facteurs de transcription partagés. Sur la base d'analyses topologiques du réseau multiomique, de nouvelles méthodes permettant de quantifier la 'distance' de chaque nœud à un sous-ensemble de gènes connus pour être associés à la maladie seront mises au point, en s'inspirant de mesures appropriées de centralité de graphes. Dans une approche complémentaire, ce réseau pourra être analysé pour identifier des modules fonctionnels, en utilisant et en adaptant des méthodes de pointe, notamment des algorithmes de kernel clustering ou d'optimisation de la modularité. Ces composantes dérivées du réseau multi-omique seront intégrées aux données déjà disponibles sur les variants et les gènes, et des méthodes d'apprentissage automatique supervisé seront appliquées pour obtenir un score intégratif unique permettant de classer les variants candidats par ordre de priorité. Données/Application : le développement de la méthode et la validation du concept s'appuieront sur un ensemble de données, disponible en interne, de séquençage d'exomes pour une cohorte d'environ 1100 patients souffrant de diverses formes d'infertilité, dont 226 pour lesquels l'étiologie génétique est connue à ce jour. Résultats attendus : des méthodes nouvelles et améliorées pour hiérarchiser les variantes génomiques dans les maladies génétiques, en s'appuyant sur l'analyse intégrative de données multi-omiques. Ces méthodes pourraient être mises en œuvre sous la forme d'un plugin Ensembl Variant Effect Predictor (VEP), pour une meilleure visibilité. Le doctorant fera partie du réseau doctoral du projet M4DI, l'un des axes du PEPR Santé Numérique. A ce titre, un séjour de recherche d'environ 4 mois dans le laboratoire secondaire (IMT Toulouse) est prévu. Le doctorant aura également la possibilité de participer à des 'data challenge' M4DI, et de collaborer avec d'autres axes du PEPR Santé Numérique.