Utilisation des signatures et de la topologie des données en détection d'anomalies et traitement du signal.
Auteur / Autrice : | Rémi Vaucher |
Direction : | Stéphane Chretien |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques |
Date : | Soutenance en 2025 |
Etablissement(s) : | Lyon 2 |
Ecole(s) doctorale(s) : | InfoMaths - Informatique et Mathématiques de Lyon |
Partenaire(s) de recherche : | Laboratoire : ERIC |
Jury : | Président / Présidente : Julien Jacques |
Examinateurs / Examinatrices : Stéphane Chretien, Lyudmila Grigoryeva, Gabriela Ciuperca, Frederic Chazal, Badih Ghattas, Marianne Clausel | |
Rapporteurs / Rapporteuses : Badih Ghattas, Marianne Clausel |
Mots clés
Résumé
Ces dernières années, la détection d'anomalies s'est imposée comme une problématique majeure dans le domaine industriel. Parallèlement, les entreprises ont mis en place de nombreuses solutions de surveillance en ligne. En combinant ces deux aspects, les algorithmes de détection d'anomalies doivent pouvoir s'appliquer aux signaux évolutifs dans le temps. Dans cette optique, nous introduisons comme outil principal la signature d'un chemin rugueux (rough path). Cet outil, développé en 1954 par K.T. Chen dans le cadre de la géométrie théorique, a été remis en avant par T. Lyons en 1998 dans le cadre des équations différentielles stochastiques impliquant des chemins rugueux. Depuis une vingtaine d'années, cet outil a entraîné une amélioration considérable de la performance de certains algorithmes appliqués aux séries temporelles. Par ailleurs, son introduction a permis la réussite dun algorithme de reconnaissance décriture chinoise. Ce qui est particulièrement intéressant, c'est que l'espace des signatures $G(R^d) subset T(R^d)$ est doté d'une structure de groupe de Lie : nous obtenons donc un homomorphisme de groupe pour les opérations importantes, accompagné dun homéomorphisme pour le transport de la topologie. Tout le long de ce manuscrit, le fil conducteur principal est létude des signaux temporels par le biais de leur organisation topologique. C'est pourquoi nous transposons ces signaux dans l'espace des signatures. Nous introduisons alors une série d'outils issus du champ de l'analyse topologique des données (TDA). Ce domaine de l'analyse statistique a émergé avec le travail d'Edelsbrunner en 2002. La TDA repose sur un principe très intuitif : un nuage de points possède une forme. Une application de ce principe dans notre contexte serait que les données fonctionnelles ont une forme sous-jacente, difficilement visualisable, dont une modification peut traduire une anomalie. Dans cette thèse, nous débutons par une démonstration de la puissance statistique (et topologique) des signatures sur des processus stochastiques modélisant un taux de biomarqueurs cancéreux. Ensuite, nous proposons un algorithme de création de structure topologique sur l'espace des signatures, en veillant à ce que cette structure reflète celle des signaux considérés. Nous approfondissons cet algorithme en introduisant un algorithme de sélection de variables et en présentant certains résultats obtenus. Enfin, un dernier chapitre s'intéresse à la détection d'anomalies par génération aléatoire de signaux temporels multivariés, en utilisant les deux outils précédemment mentionnés.