Raisonnement sur les grands flux de données : méthode de résolution de problèmes basée sur l'abstraction récursive TOM4A
Auteur / Autrice : | Fabien Vilar |
Direction : | Marc Le Goc |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 21/12/2018 |
Etablissement(s) : | Aix-Marseille |
Ecole(s) doctorale(s) : | École Doctorale Mathématiques et Informatique de Marseille (Marseille) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire des sciences de l'information et des systèmes (Marseille ; La Garde, Var ; 2002-2011) |
Jury : | Président / Présidente : Jean-Paul Comet |
Examinateurs / Examinatrices : Philippe Preux, Serge Lazzarini, Eugène Asarin, Nadia Creignou | |
Rapporteurs / Rapporteuses : Marc Aiguier, Laurent Fribourg |
Mots clés
Résumé
Ce document concerne le développement d'un cadre mathématique spécifiant une technologie capable de prendre en charge quelques unes des problématiques relevant du domaine des grands flux de données. Nous proposons de combiner le point de vue ontologique de Newell et celui épistémologique de Floridi d'abstraction pour construire des outils de transformation de modéles au moyen d'un ensemble adéquats de foncteurs au sens de la théorie des catégories de Samuel Eilenberg et Saunders Mac Lane. La méthode de résolution de problème proposée est basée sur un raisonnement d'abstraction temps réel qui produit, en ligne, une réduction d'un grand nombre de données sémantiquement pauvres en une donnée unique équivalente mais sémantiquement plus riche. Le prix à payer pour un tel enrichissement sémantique de l'information est la perte d'information syntaxique (i.e. le phénoméne d'oubli). Nos contributions sont les suivantes: (i) la démonstration que le concept d'observateur unaire de la théorie des observations datées (TOT) de Le Goc joue le même rôle qu'un échantillonneur de Dirac, (ii) la construction de la catégorie TOT(ℤ), adéquate à la formulation du processus d'abstraction proposé et (iii) la conception de la méthode de résolution de problème TOM4A (timed observations methodology for abstraction) dont une application concrète est présentée visant à découvrir et modéliser le problème complexe de la fraude interne dans le domaine bancaire