Register automata over semiring : a study along transducers
Auteur / Autrice : | Théodore Lopez |
Direction : | Jean-Marc Talbot, Benjamin Monmege |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 05/12/2023 |
Etablissement(s) : | Aix-Marseille |
Ecole(s) doctorale(s) : | École Doctorale Mathématiques et Informatique de Marseille (Marseille) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d’Informatique et Systèmes (Marseille ; La Garde, Var ; 2018-….) |
Jury : | Président / Présidente : Sylvain Salvati |
Examinateurs / Examinatrices : Jean-Marc Talbot, Benjamin Monmege, Olivier Carton, Sylvain Lombardy, Laure Daviaud, Nicolas Baudru | |
Rapporteurs / Rapporteuses : Olivier Carton, Sylvain Lombardy |
Mots clés
Résumé
La vérification automatique est un domaine clé pour la recherche depuis des dizaines d'années.Un enjeu essentiel est d'assurer des garanties formelles sur les comportements d'un système, notamment lorsqu'il traite de tâches critiques.Il y a eu de nombreux développements dans le cadre Booléen, dans lequel une propriété à vérifier peut être soit vraie, soit fausse.Pour mieux préciser les propriétés à vérifier, la recherche s'est concentrée sur des domaines quantitatifs.On peut alors mesurer des quantités, comme le coût d'une opération, le temps d'exécution d'une tâche, le nombre de résultats d'une requête.Le modèle classique pour vérifier des propriétés quantitatives est la classe des automates pondérés.Récemment, un autre modèle a été introduit: les automates à registres de coût.Contrairement aux automates pondérés, ce formalisme est déterministe.Il utilise des registres, dont le contenu ne peut être testé, les registres peuvent seulement être combinés pour produire la valeur de sortie.Dans cette thèse, nous examinons un fragment restreint appelé sans copies, dans lequel le contenu des registres ne peut jamais être dupliqué.La contribution principale est l'étude de la composition des automates à registres de coût avec une transduction, c.-à.-d. une transformation mots-dans-mots.On obtient la clôture de la classe par l'extension non-ambigüe ou par l'extension qui peut ``deviner'' une propriété régulière sur la fin du mot d'entrée. On peut alors réduire certaines conditions restrictives du modèle.Les automates pondérés alternants sont un autre modèle pour vérifier des propriétés quantitatives.Ils fonctionnent à la manière d'un système de réécriture synchronisé.Nous comparons ce modèle aux automates à registres de coût, et prouvons qu'ils ont la même expressivité, si tant est que les entrées doivent être lues à l'envers.Les liens entre automates et monoïdes sont connus.Des résultats algébriques peuvent se transcrire en des propriétés clés pour un modèle opérationnel: par exemple, l'étude des facteurs idempotents par les forêts de factorisation dues à Simon.Il y a quelques années, un paramètre de complexité pour les monoïdes, appelé la longueur D-régulière, a été remis au goût du jour. Ce paramètre a été utilisé pour améliorer la complexité d'algorithmes sur des monoïdes.Nous abordons un algorithme déterministe ``streaming'' qui calcule des factorisations d'idempotents, que nous améliorons en utilisant la longueur D-régulière. Une application est la construction efficace d'une structure de données sur un mot long permettant de répondre rapidement à des requêtes régulières sur les facteurs du mot.