Inférence géométrique en analyse de données : le point de vue de la théorie géométrique de la mesure
Auteur / Autrice : | Charly Boricaud |
Direction : | Simon Masnou |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques fondamentales |
Date : | Inscription en doctorat le 01/10/2021 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de mathématiques d'Orsay (1998-....) |
Equipe de recherche : Analyse harmonique | |
Référent : Faculté des sciences d'Orsay |
Mots clés
Résumé
Afin de faire face à l'augmentation considérable du volume des données collectées, l'automatisation des processus de traitement est un enjeu sociétal majeur. Les difficultés rencontrées sont multiples : les données recueillies sont peu structurées et potentiellement de grande dimension, prenons l'exemple d'un ensemble d'images médicales (radiographies numérisées des poumons d'un échantillon de patients) qui peut être vu comme un ensemble de points dans R^n où n est le nombre de pixels d'une image. Une hypothèse standard en intelligence artificielle ('Manifold Hypothesis') stipule qu'en dépit des apparences, un jeu de données est un sous-ensemble de petite dimension d << n de l'espace ambiant, typiquement une surface ou une sous-variété et il suffit ainsi de peu de paramètres pour les décrire. Pour revenir à l'exemple précédent, les différentes radiographies partagent beaucoup de traits communs et sont loin d'être prises aléatoirement dans R^n. Cependant, le paramétrage lisse ne permet de représenter que très approximativement certains jeux de données et il apparaît naturel d'inclure des ensembles présentant des bords, des arêtes, des auto-intersections, des branchements ... On suggère ainsi dans ce projet de faire appel à des notions de surfaces affaiblies issues de la théorie géométrique de la mesure, plus précisément aux 'varifolds', afin de modéliser la structure des données. Dans ce cadre, les techniques habituelles d'inférence géométrique (permettant d'extraire les caractéristiques géométriques d'un ensemble de points) doivent être revisitées, ce qui est précisément l'objet du projet joint.