Integrating somatic and germline multi-omics data to improve our understanding of lung cancer : a computational biology perspective - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

Integrating somatic and germline multi-omics data to improve our understanding of lung cancer : a computational biology perspective

Intégration de données multi-omiques constitutionnelles et somatiques, pour une meilleure compréhension du cancer du poumon : une approche computationnelle

Résumé

Cancer is a complex disease caused by endogenous and exogenous factors, and impacting multiple omics layers. In the past decades, the high resolution interrogation of these layers provided valuable insights on cancer etiology and development. In the case of lung cancer, both germline susceptibility and somatic landscapes were widely explored. However, the identification of disease-causal pathways is still challenging and certain cancer types remain understudied. Molecular characterization of lung cancer could thus provide new insights. Such characterization requires though to apply computational methods adapted to the complexity and the high dimensionality of omics data. In this thesis, we took advantage of integrative analyses to explore lung cancer omics data. Firstly, multi-omics data were integrated for the molecular characterization of lung neuroendocrine neoplasms. Machine learning methods identified molecular subgroups which had distinct prognoses and were clinically relevant. Subsequently, a molecular map integrating six previously published transcriptomic datasets was built. The map corroborated previous biological hypotheses and was designed to encourage the generation of new hypotheses by providing the underlying homogenized dataset as well as resources promoting reproducibility and data reuse. Finally, the interplay between germline and somatic layers in lung cancers have been explored. Associations between germline susceptibility to lung cancer and mutational burden in lung tumors were identified. While tobacco smoking susceptibility SNPs were major drivers, pleiotropic effects were also detected, suggesting that other pathways might be involved.
Le cancer est une maladie complexe causée par des facteurs endogènes et exogènes, impactant différentes couches omiques. Au cours des dernières décennies, l'interrogation de ces couches à haute résolution a permis d'étudier l'étiologie et le développement des cancers. Dans le cas du cancer du poumon, les profiles constitutionnels et somatiques ont été largement explorés. Toutefois, l'identification des gènes responsables de la maladie reste limitée et certains types de cancer sont peu étudiés. La caractérisation moléculaire des cancers du poumon pourrait donc améliorer les connaissances actuelles. Elle nécessite cependant l'application de méthodes adaptées à la complexité et la grande dimension des données omiques. Dans cette thèse, nous avons mené plusieurs approches intégratives pour explorer ces données au sein du cancer du poumon. Premièrement, nous avons intégré des données multi-omiques pour décrire les tumeurs neuroendocrines (TNE) du poumon et avons identifié, grâce à des méthodes d'apprentissage automatique, des groupes moléculaires de pronostic différents. Par la suite, une carte moléculaire intégrant six jeux de données transcriptomiques de TNE du poumon a été établie afin de favoriser la génération de nouvelles hypothèses et la réutilisation des données. Enfin, nous avons exploré l'interaction entre les évènements constitutionnels et somatiques au sein des cancers du poumon. Une association, majoritairement due à la susceptibilité au tabac, a été détectée entre les variants constitutionnels et la charge mutationnelle des tumeurs. Cependant, des effets pléiotropiques ont également été détectés, suggérant que d'autres mécanismes pourraient être impliqués.
Fichier principal
Vignette du fichier
TH2020GABRIELAURELIE.pdf (26.37 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03500628 , version 1 (22-12-2021)

Identifiants

  • HAL Id : tel-03500628 , version 1

Citer

Aurélie Gabriel. Integrating somatic and germline multi-omics data to improve our understanding of lung cancer : a computational biology perspective. Cancer. Université de Lyon, 2020. English. ⟨NNT : 2020LYSE1324⟩. ⟨tel-03500628⟩

Collections

STAR
90 Consultations
44 Téléchargements

Partager

Gmail Facebook X LinkedIn More