Thèse soutenue

Méthodes à noyaux scalaires pour l'inférence de réseaux de régulations géniques

FR  |  
EN
Auteur / Autrice : Arnaud Fouchet
Direction : Jean-Marc DelosmeFlorence D'Alché-Buc
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 10/01/2014
Etablissement(s) : Evry-Val d'Essonne
Ecole(s) doctorale(s) : École doctorale Sciences et Ingénierie (Evry ; 2008-2015)
Jury : Président / Présidente : Céline Rouveirol
Examinateurs / Examinatrices : Marie Szafranski
Rapporteur / Rapporteuse : Pierre Geurts, Alain Rakotomamonjy

Résumé

FR  |  
EN

De nouvelles technologies, notamment les puces à adn, multiplient la quantité de données disponibles pour la biologie moléculaire. dans ce contexte, des méthodes informatiques et mathématiques sont activement développées pour extraire le plus d'information d'un grand nombre de données. en particulier, le problème d'inférence de réseaux de régulation génique a été abordé au moyen de multiples modèles mathématiques et statistiques, des plus basiques (corrélation, modèle booléen ou linéaire) aux plus sophistiqués (arbre de régression, modèles bayésiens avec variables cachées). malgré leurs qualités pour des problèmes similaires, les modèles à noyaux ont été peu utilisés pour l'inférence de réseaux de régulation génique. en effet, ces méthodes fournissent en général des modèles difficiles a interpréter. dans cette thèse, nous avons développé deux façons d'obtenir des méthodes à noyaux interprétables. dans un premier temps, d'un point de vue théorique, nous montrons que les méthodes à noyaux permettent d'estimer, a partir d'un ensemble d'apprentissage, une fonction de transition et ses dérivées partielles de façon consistante. ces estimations de dérivées partielles permettent, sur des exemples réalistes, de mieux identifier le réseau de régulation génique que des méthodes standards. dans un deuxième temps, nous développons une méthode à noyau interprétable grâce à l'apprentissage à noyaux multiples. ce modèle fournit des résultats du niveau de l'état de l'art sur des réseaux réels et des réseaux simulés réalistes.