Analyse Topologique Distribuée
Auteur / Autrice : | Eve Le guillou |
Direction : | Julien Tierny, Pierre Fortin |
Type : | Projet de thèse |
Discipline(s) : | Sciences et technologies de l'information et de la communication |
Date : | Inscription en doctorat le 01/04/2022 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Laboratoire : LIP6 |
Mots clés
Résumé
L'analyse topologique de données est une thématique de recherche qui propose d'extraire, de mesurer et de comparer des informations structurelles cachées au sein de données complexes. Elle connaît un essor important depuis quelques années, dû principalement à ses succès récents en science des données et en apprentissage automatique ainsi qu'aux développements open-source récents la mettant en uvre. L'analyse topologique de données repose aujourd'hui sur une boîte à outils de représentations topologiques de données (comme le diagramme de persistance, le graphe de Reeb, le complexe de Morse-Smale) dont la concision et la pertinence pratique a été documentée dans de nombreuses applications, comme en imagerie médicale, en astrophysique, ou encore en monitoring de simulations numériques de haute performance. Cependant, la construction de ces outils est encore coûteuse en temps et difficilement envisageable pour des jeux de données de très grande taille (au-delà de 10^9 points), typiquement rencontrés dans des applications intensives à haute performance. Dans cette thèse, nous nous focaliserons sur la théorie de Morse discrète, grâce à laquelle l'équipe a déjà obtenu des résultats préliminaires très prometteurs pour le calcul de diagrammes de persistance. L'objectif de la thèse est donc de permettre le calcul de représentations topologiques de jeux de données d'une taille sans précédent dans un contexte haute performance à mémoire distribuée (i.e. sur un super-calculateur), mais aussi de traiter de gros volumes de données sur de petits matériels (i.e. ordinateur portable) en mode out-of-core.