Thèse soutenue

Vers une analyse réaliste des algorithmes de tri et de recherche

FR  |  
EN
Auteur / Autrice : Thu-Hien Nguyen-Thi
Direction : Brigitte ValléeJulien Clément
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance en 2014
Etablissement(s) : Caen
Ecole(s) doctorale(s) : École doctorale structures, informations, matière et matériaux (Caen ; 1992-2016)
Partenaire(s) de recherche : Laboratoire : Groupe de recherche en informatique, image, automatique et instrumentation de Caen (1995-....)
Jury : Président / Présidente : Danièle Gardy
Examinateurs / Examinatrices : Brigitte Vallée, Julien Clément, Danièle Gardy, Conrado Martínez, Cyril Nicaud, Philippe Duchon, Hsein-Kuei Hwang
Rapporteurs / Rapporteuses : Conrado Martínez, Cyril Nicaud

Résumé

FR  |  
EN

On revisite les algorithmes de tri et de recherche classiques en considérant que les entrées de l’algorithme sont des mots infinis et en prenant compte de comparaisons de symboles entre des mots. Nous travaillons sous des modèles probabilistes différents pour lesquels les symboles sont générés par une source générale qui comprend, par exemple, la source sans mémoire, la chaîne de Markov ou même des sources avec les corrélations non bornées. De ce point de vue, une assertion telle que « la complexité de QuickSort est O(n log n) » n’est plus vérifiée et il n’est pas aisé de comparer des algorithmes reposant sur des principes différents de comparaison entre eux. Dans ce cadre, nous trouvons que la complexité en moyenne pour le nombre de comparaisons de symboles de QuickSort devient O(n log2 n) alors que celle de QuickSelect reste en O(n). Nous proposons une méthode générale qui permet de revisiter trois algorithmes de tri QuickSort, Tri Insertion et Tri à Bulles et deux algorithmes de sélection QuickSelect et Sélection du Minimum. Pour chaque algorithme, nous calculons les asymptotiques du nombre moyen de comparaisons de symboles. Les constantes pour les termes dominants sont reliées à des notions différentes de coïncidence et dépendantes des algorithmes. Nous empruntons des méthodes de la combinatoire analytique. Dans notre cadre, nous obtenons de plus une borne inférieure pour le nombre moyen de comparaisons de symboles effectuées par des algorithmes de tri utilisant la comparaison usuelle entre des chaînes de caractères.