Apprentissage automatique d'automates temporisés à partir de séries temporelles
Auteur / Autrice : | Lénaïg Cornanguer |
Direction : | Christine Largouët, Alexandre Termier |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 02/11/2023 |
Etablissement(s) : | Université de Rennes (2023-....) |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes ; 2022-....) |
Partenaire(s) de recherche : | Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - LACODAM |
Jury : | Président / Présidente : Nicolas Markey |
Examinateurs / Examinatrices : Florent Masseglia, Sergio Yovine, Laurence Rozé | |
Rapporteurs / Rapporteuses : Antoine Cornuéjols, Anthony Bagnall |
Mots clés
Résumé
Cette thèse explore le développement de nouvelles techniques pour exploiter les données d’observation de système afin d’apprendre automatiquement des modèles de comportement. Nous utilisons le formalisme de l’automate temporisé, un automate fini dont les changements d’état sont déclenchés par des événements et contraints par le temps. Trois enjeux principaux sont abordés : (1) l’apprentissage d’automates temporisés à partir de séquences d’événements; (2) la discrétisation de séries temporelles pour permettre l’apprentissage d’automates temporisés à partir de données numériques; et (3) l’apprentissage d’automates temporisés en interaction à partir de séries temporelles. Tout d’abord, nous présentons TAG, un algorithme d’apprentissage d’automates temporisés. Une experience sur des données synthétiques démontre qu’il atteint un meilleur équilibre entre sur-ajustement et généralisation que les algorithmes de l’état de l’art. Ensuite, nous proposons MOODES, une méthode de discrétisation de séries temporelles basée sur l’optimisation de critères favorables à l’apprentissage d’automates temporisés. TAG et MOODES sont appliqués sur un défi de détection d’anomalies dans les séries temporelles avec une approche basée sur des ensembles d’automates. Enfin, nous présentons une nouvelle approche de discrétisation pour séries temporelles multivariées qui identifie et préserve les synchronisations afin d’apprendre des automates en interaction.