Exploitation de la structure des données incertaines
Auteur / Autrice : | Mouhamadou Lamine Ba |
Direction : | Talel Abdessalem, Pierre Senellart |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique et Réseaux |
Date : | Soutenance le 30/03/2015 |
Etablissement(s) : | Paris, ENST |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....) |
Jury : | Président / Présidente : Benjamin Nguyen |
Examinateurs / Examinatrices : Dario Colazzo, Stéphane Gançarski | |
Rapporteurs / Rapporteuses : Pascal Molli, Laure Berti-Équille |
Mots clés
Résumé
Cette thèse s’intéresse à certains problèmes fondamentaux découlant d’un besoin accru de gestion des incertitudes dans les applications Web multi-sources ayant de la structure, à savoir le contrôle de versions incertaines dans les plates-formes Web à large échelle, l’intégration de sources Web incertaines sous contraintes, et la découverte de la vérité à partir de plusieurs sources Web structurées. Ses contributions majeures sont : la gestion de l’incertitude dans le contrôle de versions de données arborescentes en s’appuyant sur un modèle XML probabiliste ; les étapes initiales vers un système d’intégration XML probabiliste de sources Web incertaines et dépendantes ; l’introduction de mesures de précision pour les données géographiques et ; la conception d’algorithmes d’exploration pour un partitionnement optimal de l’ensemble des attributs dans un processus de recherche de la vérité sur des sources Web conflictuelles.