Thèse soutenue

Analyse et intégration de données génomiques larges et hétérogènes : application à la différentiation des cellules B naïve et au lymphome folliculaire

FR  |  
EN
Auteur / Autrice : Marine Louarn
Direction : Anne SiegelThierry Fest
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 26/11/2020
Etablissement(s) : Rennes 1
Ecole(s) doctorale(s) : MATHSTIC
Partenaire(s) de recherche : Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Rennes, Bretagne-Atlantique) - Dyliss

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L’inférence de réseaux de régulation à partir de données hétérogènes a pour but d’identifier les régulateurs clefs impliqués dans des processus biologiques aboutissant à des cancers. Dans cette thèse, je m’intéresse à la différenciation des cellules B naïves, d'où émerge le lymphome folliculaire. Ma première contribution souligne les problèmes de réutilisation et de reproductibilité des méthodes d’inférence de réseaux actuelles. Pour surmonter ces limites, je propose une structure utilisant les technologies du Web Sémantique pour intégrer et requêter ces jeux de données hétérogènes de manière systématique (deuxième contribution). Le pipeline d'origine est reproduit par des requêtes sur le graphe de données, ce résultat peut lui-même être intégré et enrichi avec des données publiques (troisième contribution). Ceci démontre l’utilité de cette approche et de ses bénéfices en terme de réutilisation et de reproductibilité. Ma quatrième contribution est une nouvelle méthode d’inférence de réseaux prenant en compte la connaissance des experts, pour étendre l’analyse à des jeux de données restreints et biologiquement proches et pour introduire la notion de relations signées, incluant les inhibitions. Enfin, l'application de cette méthode à la différenciation des cellules B, a permis la découverte de 146 FT avec un impact potentiel majeur sur le réseau (cinquième contribution).