Méthodologie data-driven de détection séquentielle de ruptures pour des signaux physiologiques
Auteur / Autrice : | Nassim Sahki |
Direction : | Anne Gégout-Petit, Sophie Wantz Mézières |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques |
Date : | Soutenance le 29/11/2021 |
Etablissement(s) : | Université de Lorraine |
Ecole(s) doctorale(s) : | École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine (1992-....) |
Partenaire(s) de recherche : | Laboratoire : Institut Élie Cartan de Lorraine (1997-.... ; Vandoeuvre-lès-Nancy, Metz) |
Jury : | Président / Présidente : Alain Celisse |
Examinateurs / Examinatrices : Anne Gégout-Petit, Sophie Wantz Mézières, Adeline Leclercq-Samson, Christian Paroissin, Sandie Ferrigno | |
Rapporteur / Rapporteuse : Adeline Leclercq-Samson, Christian Paroissin |
Mots clés
Résumé
Cette thèse traite de la problématique de la détection de rupture dans le cadre séquentiel où le signal est supposé être observé en temps réel et le phénomène passe de son état de départ ''normal'' à un état post-changement ''anormal''. Le défi de la détection séquentielle est de minimiser le délai de détection, soumis à une limite tolérable de fausse alarme. L'idée est de tester séquentiellement l'existence d'une rupture par l'écriture récursive de la statistique de détection en fonction du score, qui remplace le Log-Likelihood Ratio lorsque la distribution des données est inconnue. La procédure de détection repose ainsi sur une statistique récursive, un seuil de détection et une règle d'arrêt. Dans un premier travail, nous considérons la statistique score-CUSUM et proposons d'évaluer la performance de détection de certains seuils de détection. Deux seuils sont issus de la littérature, et trois nouveaux seuils sont construits par une méthode basée sur la simulation: le premier est constant, le second instantané et le troisième est une version dynamique ''data-driven'' du précédent. Nous définissons rigoureusement chacun des seuils en mettant en évidence les différentes notions du risque de fausse alarme contrôlé suivant le seuil. Par ailleurs, nous proposons une nouvelle règle d'arrêt corrigée pour réduire le taux de fausse alarme. Nous effectuons ensuite une étude de simulation pour comparer les différents seuils et évaluer la règle d'arrêt corrigée. Nous constatons que le seuil empirique conditionnel est le meilleur pour minimiser le délai de détection tout en maintenant le risque toléré de fausse alarme. Cependant, sur des données réelles, nous recommandons d'utiliser le seuil data-driven car c'est le plus simple à construire et à utiliser pour une implémentation pratique. Dans la seconde partie, nous appliquons notre méthodologie de détection data-driven sur des signaux physiologiques, à savoir des signaux temporels enregistrés au niveau du faisceau supérieur du trapèze de 30 sujets effectuant différentes activités bureautiques. La méthodologie est sujet-activité dépendante; elle inclut l'estimation on-line des paramètres du signal et la construction du seuil data-driven sur le début du signal de chaque activité de chaque sujet. L'objectif était d'identifier des changements de régimes au cours d'une activité afin d'évaluer le niveau de sollicitation du muscle et la variabilité du signal EMG, qui sont liés à la fatigue musculaire. Les résultats obtenus ont confirmé l'aisance de notre méthodologie et la performance et praticité du seuil data-driven proposé. Par la suite, les résultats ont permis la caractérisation de chaque type d'activité en utilisant des modèles mixtes.