Thèse soutenue

Analyse en composantes indépendantes du transcriptome de cancers

FR  |  
EN
Auteur / Autrice : Anne Biton
Direction : François Radvanyi
Type : Thèse de doctorat
Discipline(s) : Cancérologie
Date : Soutenance le 28/06/2011
Etablissement(s) : Paris 11
Ecole(s) doctorale(s) : Ecole doctorale Cancérologie : Biologie, Médecine, Santé (2000-2015 ; Le Kremlin-Bicêtre, Val-de-Marne)
Partenaire(s) de recherche : Laboratoire : Centre de bio-informatique (Fontainebleau, Seine et Marne)
Equipe de recherche : Mécanismes moléculaires du développement de la glande mammaire
Jury : Président / Présidente : Christine Froidevaux
Examinateurs / Examinatrices : François Radvanyi, Christine Froidevaux, Alex Duval, Andrew Teshendorff
Rapporteurs / Rapporteuses : Alex Duval, Andrew Teshendorff

Résumé

FR  |  
EN

L'analyse de données d'expression montre qu'il est avantageux d'analyser les processus biologiques en termes de modules plutôt que simplement considérer les gènes un par un. Dans ce projet nous avons conduit une analyse non supervisée des données d'expression de gènes de plusieurs cohortes de tumeurs urothéliales en appliquant la méthode d'Analyse en Composantes Indépendantes. Plusieurs études ont démontré les meilleures performances de l'ACI par rapport à l'ACP et les méthodes de clustering, pour obtenir une décomposition plus réaliste des données d'expression en patterns d'expression pertinents et associés avec le phénotype d'intérêt.Les tumeurs urothéliales apparaissent et évoluent selon deux voies distinctes dont la probabilité de progression en cancer musculo-invasif diffère radicalement. Excepté la mutation de FGFR3 dans le groupe le moins agressif, les processus moléculaires sous-jacents n'ont pas été complètement identifiés. Le principal objectif de cette thèse était dédié aux interprétations biologiques des différentes composantes indépendantes pour aider à confirmer et étendre la liste des processus biologiques connus pour être impliqués dans le cancer de vessie.Chaque composante indépendante est caractérisée par une liste de projections de gènes et de contributions pondérées d'échantillons tumoraux . En combinant expertise biologique et comparaison des listes de gènes à des voies existantes et en étudiant conjointement l'association des composantes aux annotations cliniques et moléculaires, nous avons pu différencier les CIscausées par des facteurs techniques, tels que le prélèvement chirurgical de celles ayant des interprétations biologiques pertinentes. De plus, parmi les signaux pertinents biologiquement, cette analyse nous a permis de différencier les signaux provenant du stroma, comme la réponse immunitaire médiée par les lymphocytesB&T, de ceux produits par les tumeurs elles-mêmes, comme les signaux reliés à la prolifération ou à la différenciation. La classification des tumeurs selon leurs contributions à certaines CIs a pu être étroitement associée à des annotations anatomo-cliniques, et a mis en évidence de nouveaux sous-types de tumeur spotentiels, qui suggèrent l'existence de voies de progression supplémentaires dans le cancer de vessie. De façon similaire, l'étude des contributions de groupes de tumeurs basés sur des annotations cliniques ou moléculaires a montré différents niveaux de contamination par le stroma entre les tumeurs mutées et nonmutées pour FGFR3. La reproductibilité des composantes a été étudiée en utilisant des graphes de corrélation. La majeure partie des CIs interprétées a été validée sur trois jeux de données indépendants, et plusieurs d'entre elles ont aussi détectées dans un jeu de données de lignées cellulaires.Une deuxième étude sur le rétinoblastome a montré que nous pouvions tirer partie de l'ACI dans des contextes variés. Le rétinoblastome est initié par la perte des deux alléles du gène suppresseur de tumeur RB1. D'autres évènements génomiques non identifiés sont nécessaires à la progression de la maladie. Nous avons observé une association entre âge des patients et altérations génomiques. Les patients jeunes présentant moins d'altérations que les patients âgés, ces derniers présentant des gains du 1q et des pertes du 16q. Cette séparation des tumeurs selon l'âge est également observée sur les données d'expression, notamment en appliquant l'ACI dont l'une des composantes discrimine les patients selon leur âge. Ces résultats suggèrent l'existence de deux voies de progression dans le rétinoblastome. L'analyse des données à haut débit fournit de nombreuses listes de gènes. Afin de les interpréter, une possibilité est d'extraire les dernières publications groupées par sujets prédéfinis (fonction, localisation,...).