Méthodes à noyaux scalaires pour l'inférence de réseaux de régulations géniques
Auteur / Autrice : | Arnaud Fouchet |
Direction : | Jean-Marc Delosme, Florence D'Alché-Buc |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 10/01/2014 |
Etablissement(s) : | Evry-Val d'Essonne |
Ecole(s) doctorale(s) : | École doctorale Sciences et Ingénierie (Evry ; 2008-2015) |
Jury : | Président / Présidente : Céline Rouveirol |
Examinateurs / Examinatrices : Marie Szafranski | |
Rapporteur / Rapporteuse : Pierre Geurts, Alain Rakotomamonjy |
Mots clés
Résumé
De nouvelles technologies, notamment les puces à adn, multiplient la quantité de données disponibles pour la biologie moléculaire. dans ce contexte, des méthodes informatiques et mathématiques sont activement développées pour extraire le plus d'information d'un grand nombre de données. en particulier, le problème d'inférence de réseaux de régulation génique a été abordé au moyen de multiples modèles mathématiques et statistiques, des plus basiques (corrélation, modèle booléen ou linéaire) aux plus sophistiqués (arbre de régression, modèles bayésiens avec variables cachées). malgré leurs qualités pour des problèmes similaires, les modèles à noyaux ont été peu utilisés pour l'inférence de réseaux de régulation génique. en effet, ces méthodes fournissent en général des modèles difficiles a interpréter. dans cette thèse, nous avons développé deux façons d'obtenir des méthodes à noyaux interprétables. dans un premier temps, d'un point de vue théorique, nous montrons que les méthodes à noyaux permettent d'estimer, a partir d'un ensemble d'apprentissage, une fonction de transition et ses dérivées partielles de façon consistante. ces estimations de dérivées partielles permettent, sur des exemples réalistes, de mieux identifier le réseau de régulation génique que des méthodes standards. dans un deuxième temps, nous développons une méthode à noyau interprétable grâce à l'apprentissage à noyaux multiples. ce modèle fournit des résultats du niveau de l'état de l'art sur des réseaux réels et des réseaux simulés réalistes.