Persistance et Faisceaux : de la Théorie aux Applications
Auteur / Autrice : | Nicolas Berkouk |
Direction : | Steve Oudot |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique, données, IA |
Date : | Soutenance le 24/09/2020 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de l'Institut polytechnique de Paris |
Partenaire(s) de recherche : | établissement opérateur d'inscription : École polytechnique (Palaiseau, Essonne ; 1795-....) |
Laboratoire : Datashape - Understanding the shape of data | |
Jury : | Président / Présidente : Pierre Schapira |
Examinateurs / Examinatrices : Steve Oudot, Claude Viterbo, Ezra Miller, Ulrike Luise Tillmann, Ulrich Bauer, Justin Curry | |
Rapporteur / Rapporteuse : Claude Viterbo, Ezra Miller |
Mots clés
Mots clés contrôlés
Résumé
L’analyse de données topologique est un domaine de recherche récent qui vise à employer les techniques de la topologie algébrique pour concevoir des descripteurs de jeux de données. Pour être utiles en pratique, ces descripteurs doivent être calculables, et posséder une notion de métrique, afin de pouvoir exprimer leur stabilité vis à vis du bruit inhérent à toutes données réelles. La théorie de la persistance a été élaborée au début des années 2000 commeun premier cadre th éorique permettant de définir detels descripteurs - les désormais bien connus codebarres. Bien que très bien adaptée à un contexte informatique, la théorie de la persistance possède certaines limitations théoriques. Dans ce manuscript,nous établissons des liens explicites entre la théorie dérivée des faisceaux munie de la distance de convolution(d’après Kashiwara-Schapira) et la théorie de la persistance.Nous commençons par montrer un théorème d’isométrie dérivée pour les faisceaux constructibles sur R, c’est à dire, nous exprimons la distance deconvolution comme une distance d’appariement entreles code-barres gradués de ces faisceaux. Cela nous permet de conclure dans ce cadre que la distance de convolution est fermée, ainsi que la classe des faisceaux constructibles sur R munie de la distance de convolution forme un espace topologique localement connexe par arcs. Nous observons ensuite que la collection desmodules de persistance zig-zag associée à une fonction à valeurs réelle possède une structure supplémentaire, que nous appelons systèmes de Mayer-Vietoris. Sous des hypothèses de finitude, nous classifions tous les systèmes de Mayer-Vietoris. Cela nous permet d’établir une correspondence fonctorielle et isométrique entre la catégorie dérivée des faisceaux constructibles sur R équipée de la distance de convolution, et la catégorie des systèmes de Mayer-Vietoris fortement finis munie de la distance d’entrelacement. Nous en déduisons une méthode de calcul des code-barres gradués faisceautiques à partir de programmes informatiques déjà implémentés par la communauté de la persistance. Nous terminons par donner une définition purement faisceautique de la notion de module de persistance éphémère. Nous établissons que la catégorie observable des modules de persistance (le quotient de la catégorie des modules de persistance par la sous catégorie des modules de persistance éphémères)est équivalente à la catégorie bien connue des -faisceaux.