Thèse soutenue

Apprentissage automatique d'automates temporisés à partir de séries temporelles

FR  |  
EN
Auteur / Autrice : Lénaïg Cornanguer
Direction : Christine LargouëtAlexandre Termier
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 02/11/2023
Etablissement(s) : Université de Rennes (2023-....)
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes ; 2022-....)
Partenaire(s) de recherche : Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - LACODAM
Jury : Président / Présidente : Nicolas Markey
Examinateurs / Examinatrices : Florent Masseglia, Sergio Yovine, Laurence Rozé
Rapporteurs / Rapporteuses : Antoine Cornuéjols, Anthony Bagnall

Résumé

FR  |  
EN

Cette thèse explore le développement de nouvelles techniques pour exploiter les données d’observation de système afin d’apprendre automatiquement des modèles de comportement. Nous utilisons le formalisme de l’automate temporisé, un automate fini dont les changements d’état sont déclenchés par des événements et contraints par le temps. Trois enjeux principaux sont abordés : (1) l’apprentissage d’automates temporisés à partir de séquences d’événements; (2) la discrétisation de séries temporelles pour permettre l’apprentissage d’automates temporisés à partir de données numériques; et (3) l’apprentissage d’automates temporisés en interaction à partir de séries temporelles. Tout d’abord, nous présentons TAG, un algorithme d’apprentissage d’automates temporisés. Une experience sur des données synthétiques démontre qu’il atteint un meilleur équilibre entre sur-ajustement et généralisation que les algorithmes de l’état de l’art. Ensuite, nous proposons MOODES, une méthode de discrétisation de séries temporelles basée sur l’optimisation de critères favorables à l’apprentissage d’automates temporisés. TAG et MOODES sont appliqués sur un défi de détection d’anomalies dans les séries temporelles avec une approche basée sur des ensembles d’automates. Enfin, nous présentons une nouvelle approche de discrétisation pour séries temporelles multivariées qui identifie et préserve les synchronisations afin d’apprendre des automates en interaction.