Thèse soutenue

Analyse intégrée de données de génomique et d’imagerie pour le diagnostic et le suivi du gliome malin chez l’enfant

FR  |  
EN
Auteur / Autrice : Cathy Philippe
Direction : Vincent Frouin
Type : Thèse de doctorat
Discipline(s) : Physique
Date : Soutenance le 08/12/2014
Etablissement(s) : Paris 11
Ecole(s) doctorale(s) : Ecole doctorale Sciences et Technologies de l'Information, des Télécommunications et des Systèmes (Orsay, Essonne ; 2000-2015)
Partenaire(s) de recherche : Laboratoire : Vectorologie et thérapeutiques anti-cancéreuses (Villejuif, Val-de-Marne ; 2010-2019)
Jury : Président / Présidente : Daniel Gautheret
Examinateurs / Examinatrices : Vincent Frouin, Daniel Gautheret, Hervé Abdi, Jean-François Zagury, Arthur Tenenhaus, Vincent Guillemot, Philippe Bastien, Stéphanie Bougeard
Rapporteur / Rapporteuse : Hervé Abdi, Jean-François Zagury

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les tumeurs cérébrales malignes sont la première cause de mortalité par cancer chez l’enfant avec une survie médiane de 12 à 14 mois et une survie globale à 5 ans de 20%, pour les gliomes de haut grade. Ce travail de thèse propose des méthodes innovantes pour l’analyse de blocs de données de génomiques, dans le but d’accroître les connaissances biologiques sur ces tumeurs. Les méthodes proposées étendent les travaux de Tenenhaus et al (2011), introduisant le cadre statistique général : Regularized Generalized Canonical Correlation Analysis (RGCCA). Dans un premier temps, nous étendons RGCCA à la gestion de données en grande dimension via une écriture duale de l’algorithme initial (KGCCA). Dans un deuxième temps, la problématique de la sélection de variables dans un contexte multi-Blocs est étudiée. Nous en proposons une solution avec la méthode SGCCA, qui pénalise la norme L1 des poids des composantes. Dans un troisième temps, nous nous intéressons à la nature des liens entre blocs avec deux autres adaptations. D’une part, la régression logistique multi-Blocs (multiblog) permet de prédire une variable binaire, comme la réponse à un traitement. D’autre part, le modèle de Cox multi-Blocs (multiblox) permet d’évaluer, par exemple, le risque instantané de rechute. Enfin, nous appliquons ces méthodes à l’analyse conjointe des données de transcriptome et d’aberrations du nombre de copies, acquises sur une cohorte de 53 jeunes patients avec un gliome de haut grade primaire. Les résultats sont décrits dans le dernier chapitre du manuscrit.