Thèse soutenue

Algorithmes probabilistes pour la fouille quantitative de données et la génération aléatoire

FR  |  
EN
Auteur / Autrice : Jérémie Lumbroso
Direction : Philippe FlajoletMichèle Soria
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2012
Etablissement(s) : Paris 6

Résumé

FR  |  
EN

Cette thèse examine deux types de problèmes: l'analyse de grands flux de données réelles, et le problème complémentaire de la génération de grande quantités de données aléatoires. Pour cela, elle exploite un ensemble d'outils communs que sont la combinatoire analytique (et les fonctions génératrices), l'énumeration, les probabilités, les algorithmes probabilitistes, avec en particulier la méthode Boltzmann pour la génération aléatoire. Tout d'abord, nous étudions des algorithmes de traitement de données: ces algorithmes sont capables d'extraire des informations de grands flux de données en utilisant des ressources très limitées (notamment pour ce qui est de la mémoire et du temps de traitement par élément du flux). Une des nos contributions principales est de livrer l'analyse complète d'un algorithme optimal pour l'estimation du nombre d'éléments distincts dans un flux, un problème qui a suscité de nombreux travaux. Notre seconde contribution, un travail en commun avec des chercheurs de l'UPC à Barcelone, est d'introduire un estimateur novateur du nombre distinct d'éléments sui se base sur des statistiques sur les permutations. La seconde partie se concentre sur la génération aléatoire de lois discrètes, et d'objets combinatoires. Nous introduisons le premier algorithme optimal pour la génération de la loi uniforme discrète, un élément central utilisé pour les simulations par ordinateur. Nous introduisons aussi, dans un travail en commun avec Olivier Bodini, une extension du modèle de Boltzmann pour permettre la génération aléatoire d'une nouvelle sorte d'objets appartenant à la combinatoire dite multiplicative, qui possède des liens étroits avec la théorie analytique des nombres. Enfin, toujours avec Olivier Bodini, nous présentons un travail en cours qui pourraient permettre d'améliorer l'aspect pratique de la méthode de Boltzmann.