Intégration de données multimodales pour une meilleur comprehension de l'hétérogénéité tumorale
Auteur / Autrice : | Gauthier Delrot |
Direction : | Macha Nikolski |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 05/02/2024 |
Etablissement(s) : | Bordeaux |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et informatique (Talence, Gironde ; 1991-....) |
Partenaire(s) de recherche : | Laboratoire : Institut de Biochimie et Génétique Cellulaires |
Equipe de recherche : Computational Biology and Bioinformatics |
Mots clés
Mots clés libres
Résumé
Nous proposons une thèse entièrement financée (par l'Institut National du Cancer, INCA) à l'intersection de deux équipes dynamiques au sein de l'Institut IBGC CNRS, celles dirigées par Macha Nikolski et Thomas Daubon. L'objectif central de ce projet de doctorat sera d'appliquer des modèles informatiques et l'apprentissage automatique pour intégrer des ensembles de données spatiales multi-omiques en application au glioblastome. Les glioblastomes sont des tumeurs très agressives avec une forte hétérogénéité intratumorale et des communications métaboliques entre ces zones sous-tumorales, comme la récente publication conjointe des groupes du Dr Daubon et du Dr Nikolski (Guyon et al., EMBO Mol Med 2022). Des jeux de données multimodaux (transcriptomique, métabolomique et microbiome) sont déjà disponibles et de nouvelles données seront acquises. En particulier, nous développons des stratégies pour (i) l'analyse conjointe des données de transcriptomique, de métabolomique et de microbiome, dans le contextes de tumeur primaire et lors de la rechute afin de mieux évaluer les mécanismes de résistance et d'invasion et (ii) la cartographie spatiale des réseaux métaboliques combinant l'imagerie par spectrométrie de masse de métabolites, avec transcriptomique spatiale. Ces ensembles de données sont complexes et nécessitent une expertise en bioinformatique et en sciences computationnelles pour être pleinement exploités. Plusieurs défis techniques seront relevés dans ce projet. L'une des principales difficultés pour analyser efficacement les données spatiales multi-omiques est l'intégration d'ensembles de données avec différentes résolutions. De plus, il est nécessaire de tenir compte du fait que certaines données peuvent être acquises sur de petites sous-sections d'un tissu et d'autres sur l'ensemble de la tranche de tissu, ce qui complique le processus d'intégration des données car il n'y a pas de correspondance biunivoque entre les points de données. L'intégration avec le microbiome apportera le défi de combiner non seulement des types de données hétérogènes, mais aussi des données quasi-complètes avec des données sparse. Par conséquent, cela nécessite des approches de science des données spécialisées et adaptées qui sont interprétables du point de vue biologique/physiologique et facilitent simultanément l'extraction d'associations explicables entre les entités. Le doctorant doit s'inscrire dans un programme doctoral à l'Université de Bordeaux, ainsi que participer à des activités de formation complémentaire.