Thèse en cours

Analyse Topologique Distribuée

FR  |  
EN
Auteur / Autrice : Eve Le guillou
Direction : Julien TiernyPierre Fortin
Type : Projet de thèse
Discipline(s) : Sciences et technologies de l'information et de la communication
Date : Inscription en doctorat le 01/04/2022
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche : Laboratoire : LIP6

Résumé

FR  |  
EN

L'analyse topologique de données est une thématique de recherche qui propose d'extraire, de mesurer et de comparer des informations structurelles cachées au sein de données complexes. Elle connaît un essor important depuis quelques années, dû principalement à ses succès récents en science des données et en apprentissage automatique ainsi qu'aux développements open-source récents la mettant en œuvre. L'analyse topologique de données repose aujourd'hui sur une boîte à outils de représentations topologiques de données (comme le diagramme de persistance, le graphe de Reeb, le complexe de Morse-Smale) dont la concision et la pertinence pratique a été documentée dans de nombreuses applications, comme en imagerie médicale, en astrophysique, ou encore en monitoring de simulations numériques de haute performance. Cependant, la construction de ces outils est encore coûteuse en temps et difficilement envisageable pour des jeux de données de très grande taille (au-delà de 10^9 points), typiquement rencontrés dans des applications intensives à haute performance. Dans cette thèse, nous nous focaliserons sur la théorie de Morse discrète, grâce à laquelle l'équipe a déjà obtenu des résultats préliminaires très prometteurs pour le calcul de diagrammes de persistance. L'objectif de la thèse est donc de permettre le calcul de représentations topologiques de jeux de données d'une taille sans précédent dans un contexte haute performance à mémoire distribuée (i.e. sur un super-calculateur), mais aussi de traiter de gros volumes de données sur de petits matériels (i.e. ordinateur portable) en mode out-of-core.