Thèse soutenue

Modèles multi-couches et méthodes d’exploration de réseaux biologiques

FR  |  
EN
Auteur / Autrice : Anthony Baptista
Direction : Anaïs BaudotAitor Gonzalez
Type : Thèse de doctorat
Discipline(s) : Biologie santé. Génomique et bioinformatique
Date : Soutenance le 13/10/2022
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : École Doctorale Sciences de la Vie et de la Santé (Marseille)
Partenaire(s) de recherche : Laboratoire : Centre de génétique médicale de Marseille (Marseille) - TAGC. Technological advances for genomics and clinics (marseille)
Jury : Président / Présidente : Alain Barrat
Examinateurs / Examinatrices : Jean-Philippe Vert
Rapporteur / Rapporteuse : Fabrizio De Vico Fallani, Sophie Donnet

Résumé

FR  |  
EN

La quantité de données, ainsi que leur variété et leur hétérogénéité, augmentent depuis de nombreuses années. Cette disponibilité des données à grande échelle représente une opportunité sans précédent pour mieux comprendre les systèmes complexes. Parmi les modes de représentation de données, les réseaux apparaissent comme particulièrement couronnés de succès. En effet, il existe une grande variété d'outils provenant de la théorie des graphes pour les explorer et en extraire des connaissances pertinentes. Cependant, l'exploration de grands jeux de données multi-dimensionnelles demeure un défi important. Les réseaux multi-couches apparaissent dans ce contexte comme un outil prometteur pour la représentation et l’analyse de ces données biologiques. Cependant, les méthodes actuelles sont limitées par le nombre et la variété de combinaisons de réseaux qu'elles peuvent explorer. Par conséquent, de nouvelles méthodes analytiques et numériques doivent être développées. Dans le cadre de ma thèse, je propose un nouveau formalisme mathématique, associé à une librairie Python nommée MultiXrank, pour intégrer et explorer n'importe quelles combinaisons de réseaux. J'ai également appliqué cette nouvelle approche à plusieurs questions biologiques. Je me suis également intéressé à la généralisation de la similarité de Katz aux réseaux multi-couches. J'ai aussi développé une nouvelle approche de détection de communautés. Enfin, je me suis intéressé à l'embedding de réseaux, en particulier au cas des méthodes du type shallow embedding. Dans ce cadre, j'ai réalisé une revue de littérature et développé une méthode d'embedding basée sur MultiXrank.