Thèse soutenue

Fouille de motifs en parallèle dans des environnements massivement distribués

FR  |  
EN
Auteur / Autrice : Saber Salah
Direction : Florent Masseglia
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 20/04/2016
Etablissement(s) : Montpellier
Ecole(s) doctorale(s) : École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique, de robotique et de micro-électronique (Montpellier ; 1992-....)
Jury : Président / Présidente : Omar Boucelma
Examinateurs / Examinatrices : Florent Masseglia, Omar Boucelma, Alexandre Termier, Arnaud Giacometti, Nadine Hilgert, Reza Akbarinia
Rapporteurs / Rapporteuses : Alexandre Termier, Arnaud Giacometti

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Le volume des données ne cesse de croître. À tel point qu'on parle aujourd'hui de "Big Data". La principale raison se trouve dans les progrès des outils informatique qui ont offert une grande flexibilité pour produire, mais aussi pour stocker des quantités toujours plus grandes. Les méthodes d'analyse de données ont toujours été confrontées à des quantités qui mettent en difficulté les capacités de traitement, ou qui les dépassent. Pour franchir les verrous technologiques associés à ces questions d'analyse, la communauté peut se tourner vers les techniques de calcul distribué. En particulier, l'extraction de motifs, qui est un des problèmes les plus abordés en fouille de données, présente encore souvent de grandes difficultés dans le contexte de la distribution massive et du parallélisme. Dans cette thèse, nous abordons deux sujets majeurs liés à l'extraction de motifs : les motifs fréquents, et les motifs informatifs (i.e., de forte entropie).