Thèse en cours

Profondeur de données à grande échelle : calcul et applications

FR  |  
EN
Auteur / Autrice : Jérémy Guérin
Direction : Pavlo Mozharovskyi
Type : Projet de thèse
Discipline(s) : Mathématiques appliquées
Date : Inscription en doctorat le 01/04/2022
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard
Partenaire(s) de recherche : Laboratoire : Laboratoire de Traitement et Communication de l'Information
Equipe de recherche : S2A - Statistique et Apprentissage

Résumé

FR  |  
EN

Introduit par John Tukey, la profondeur des données mesure la centralité d'une observation par rapport aux données. Étant non paramétrique, robuste, possédant des propriétés d'invariance attrayantes, la profondeur des données remplace la densité et les quantiles dans de nombreuses applications. Cependant, ses applications à grande échelle sont entravées par l'infaisabilité computationnelle. Le projet LS-Depth-CaP aborde cette question de manière systématique. Comme objectif principal, un lien entre les propriétés statistiques et computationnelles de la profondeur des données devrait être établi. En outre, une technique d'optimisation basée sur le gradient pour une profondeur de données lissée doit être développée avec des garanties statistiques correspondantes. Une librairie Python doit implémenter les résultats obtenus. Celle-ci sera utilisé dans des applications : analyse statistique des images cérébrales du tenseur de diffusion et spectres multivariés des matériaux de construction.