Modèles multi-couches et méthodes d’exploration de réseaux biologiques
Auteur / Autrice : | Anthony Baptista |
Direction : | Anaïs Baudot, Aitor Gonzalez |
Type : | Thèse de doctorat |
Discipline(s) : | Biologie santé. Génomique et bioinformatique |
Date : | Soutenance le 13/10/2022 |
Etablissement(s) : | Aix-Marseille |
Ecole(s) doctorale(s) : | École Doctorale Sciences de la Vie et de la Santé (Marseille) |
Partenaire(s) de recherche : | Laboratoire : Centre de génétique médicale de Marseille (Marseille) - TAGC. Technological advances for genomics and clinics (marseille) |
Jury : | Président / Présidente : Alain Barrat |
Examinateurs / Examinatrices : Jean-Philippe Vert | |
Rapporteur / Rapporteuse : Fabrizio De Vico Fallani, Sophie Donnet |
Mots clés
Résumé
La quantité de données, ainsi que leur variété et leur hétérogénéité, augmentent depuis de nombreuses années. Cette disponibilité des données à grande échelle représente une opportunité sans précédent pour mieux comprendre les systèmes complexes. Parmi les modes de représentation de données, les réseaux apparaissent comme particulièrement couronnés de succès. En effet, il existe une grande variété d'outils provenant de la théorie des graphes pour les explorer et en extraire des connaissances pertinentes. Cependant, l'exploration de grands jeux de données multi-dimensionnelles demeure un défi important. Les réseaux multi-couches apparaissent dans ce contexte comme un outil prometteur pour la représentation et l’analyse de ces données biologiques. Cependant, les méthodes actuelles sont limitées par le nombre et la variété de combinaisons de réseaux qu'elles peuvent explorer. Par conséquent, de nouvelles méthodes analytiques et numériques doivent être développées. Dans le cadre de ma thèse, je propose un nouveau formalisme mathématique, associé à une librairie Python nommée MultiXrank, pour intégrer et explorer n'importe quelles combinaisons de réseaux. J'ai également appliqué cette nouvelle approche à plusieurs questions biologiques. Je me suis également intéressé à la généralisation de la similarité de Katz aux réseaux multi-couches. J'ai aussi développé une nouvelle approche de détection de communautés. Enfin, je me suis intéressé à l'embedding de réseaux, en particulier au cas des méthodes du type shallow embedding. Dans ce cadre, j'ai réalisé une revue de littérature et développé une méthode d'embedding basée sur MultiXrank.