Thèse soutenue

Analyse et conception d’algorithmes de recherche de motifs

FR  |  
EN
Auteur / Autrice : Omar Aït Mous
Direction : Frédérique Bassino
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2012
Etablissement(s) : Paris 13

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Dans cette thèse, on s’intéresse à la construction efficace de l’automate minimal de A∗X, où X est un motif sur un alphabet A, qui intervient dans la recherche de motifs. Lorsque le motif est un mot seul, l’automate de Knuth-Morris-Pratt est minimal, et la complexité de sa construction est linéaire en la longueur du mot. Pour un ensemble fini de mots, la construction classique de Aho et Corasick produit un automate qui reconnaît le langage A∗X, mais qui n’est pas toujours minimal. On propose dans un premier temps un algorithme qui construit génériquement l’automate minimal de A∗X, lorsque X contient m mots (pour m fixé). Cette construction, inspirée par l’algorithme de minimisation de Brzozowski, utilise des listes creuses pour obtenir une complexité linéaire en temps. Une autre approche pour la construction de cet automate minimal consiste en la minimisation de l’automate de Aho-Corasick, et on présente un algorithme de pseudo-minimisation, de complexité linéaire, qui produit un automate dont la taille est entre celle de l’automate en entrée et celle de l’automate minimal. On démontre ensuite que l’automate obtenu est génériquement minimal, pourvu que le motif satisfasse aux conditions de faible corrélation que l’on définit. On donne ensuite un algorithme de complexitégénériquement linéaire qui produit avec certitude l’automate minimal. Finalement, on présente une construction directe de l’automate pseudo-minimal, évitant ainsi la construction au préalable de l’automate de Aho-Corasick.