Théorie des fonctions de croyance : application des outils de data mining pour le traitement des données imparfaites

par Ahmed Samet

Thèse de doctorat en Génie informatique et automatique

Sous la direction de Eric Lefèvre et de Sadok Ben Yahia.

Soutenue le 03-12-2014

à l'Artois en cotutelle avec l'Université de Tunis El Manar , dans le cadre de Ecole doctorale Sciences pour l'Ingénieur .

Le président du jury était Didier Dubois.

Le jury était composé de Eric Lefèvre, Sadok Ben Yahia, Didier Dubois, Arnaud Martin, Zied Elouedi, Mohamed Mohsen Gammoudi.

Les rapporteurs étaient Arnaud Martin, Zied Elouedi.


  • Résumé

    Notre travail s'inscrit dans l'intersection de deux disciplines qui sont la Théorie des Fonctions de Croyance (TFC) et la fouille de données. L'interaction pouvant exister entre la TFC et la fouille de données est étudiée sous deux volets.La première interaction souligne l'apport des règles associatives génériques au sein de la TFC. Nous nous sommes intéressés au problème de fusion de sources non fiables dont la principale conséquence est l'apparition de conflit lors de la combinaison. Une approche de gestion de conflit reposant sur les règles d'association génériques appelé ACM a été proposée.La deuxième interaction s'intéresse aux bases de données imparfaites en particulier les bases de données évidentielles. Les informations, représentées par des fonctions de masse, sont étudiées afin d'extraire des connaissances cachées par le biais des outils de fouille de données. L'extraction des informations pertinentes et cachées de la base se fait grâce à la redéfinition de la mesure du support et de la confiance. Ces mesures introduites ont été les fondements d'un nouveau classifieur associatif que nous avons appelé EDMA.

  • Titre traduit

    Belief function theory : application of data mining tools for imperfect data treatment


  • Résumé

    This thesis explores the relation between two domains which are the Belief Function Theory (BFT) and data mining. Two main interactions between those domain have been pointed out.The first interaction studies the contribution of the generic associative rules in the BFT. We were interested in managing conflict in case of fusing conflictual information sources. A new approach for conflict management based on generic association rules has been proposed called ACM.The second interation studies imperfect databases such as evidential databases. Those kind of databases, where information is represented by belief functions, are studied in order to extract hidden knowledges using data mining tools. The extraction of those knowledges was possible thanks to a new definition to the support and the confidence measures. Those measures were integrated into a new evidential associative classifier called EDMA.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?