Thèse soutenue

Inférence de réseaux de régulation génétique à partir de données du transcriptome non indépendamment et indentiquement distribuées

FR  |  
EN
Auteur / Autrice : Camille Charbonnier
Direction : Christophe AmbroiseJulien Chiquet
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 04/12/2012
Etablissement(s) : Evry-Val d'Essonne
Ecole(s) doctorale(s) : Ecole doctorale des Génomes aux organismes (Versailles ; 2000-2015)
Jury : Président / Présidente : Christophe Giraud-Audine
Examinateurs / Examinatrices : Sophie Lèbre
Rapporteur / Rapporteuse : Stéphane Canu, Sylvie Huet

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Cette thèse étudie l'inférence de modèles graphiques Gaussiens en grande dimension à partir de données du transcriptome non indépendamment et identiquement distribuées dans l'objectif d'estimer des réseaux de régulation génétique. Dans ce contexte de données en grande dimension, l'hétérogénéité des données peut être mise à profit pour définir des méthodes de régularisation structurées améliorant la qualité des estimateurs. Nous considérons tout d'abord l'hétérogénéité apparaissant au niveau du réseau, fondée sur l'hypothèse que les réseaux biologiques sont organisés, ce qui nous conduit à définir une régularisation l1 pondérée. Modélisant l'hétérogénéité au niveau des données, nous étudions les propriétés théoriques d'une méthode de régularisation par bloc appelée coopérative-Lasso, définie dans le but de lier l'inférence sur des jeux de données distincts mais proches en un certain sens. Pour finir, nous nous intéressons au problème central de l'incertitude des estimations, définissant un test d'homogénéité pour modèle linéaire en grande dimension.