Inférence de réseaux de régulation génétique à partir de données du transcriptome non indépendamment et indentiquement distribuées
Auteur / Autrice : | Camille Charbonnier |
Direction : | Christophe Ambroise, Julien Chiquet |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 04/12/2012 |
Etablissement(s) : | Evry-Val d'Essonne |
Ecole(s) doctorale(s) : | Ecole doctorale des Génomes aux organismes (Versailles ; 2000-2015) |
Jury : | Président / Présidente : Christophe Giraud-Audine |
Examinateurs / Examinatrices : Sophie Lèbre | |
Rapporteur / Rapporteuse : Stéphane Canu, Sylvie Huet |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse étudie l'inférence de modèles graphiques Gaussiens en grande dimension à partir de données du transcriptome non indépendamment et identiquement distribuées dans l'objectif d'estimer des réseaux de régulation génétique. Dans ce contexte de données en grande dimension, l'hétérogénéité des données peut être mise à profit pour définir des méthodes de régularisation structurées améliorant la qualité des estimateurs. Nous considérons tout d'abord l'hétérogénéité apparaissant au niveau du réseau, fondée sur l'hypothèse que les réseaux biologiques sont organisés, ce qui nous conduit à définir une régularisation l1 pondérée. Modélisant l'hétérogénéité au niveau des données, nous étudions les propriétés théoriques d'une méthode de régularisation par bloc appelée coopérative-Lasso, définie dans le but de lier l'inférence sur des jeux de données distincts mais proches en un certain sens. Pour finir, nous nous intéressons au problème central de l'incertitude des estimations, définissant un test d'homogénéité pour modèle linéaire en grande dimension.