Thèse en cours

Gestion de la qualité de données, basée sur le contexte, dans les systèmes d'information hétérogènes
FR  |  
EN
Auteur / Autrice : Flavia Flavia Serra
Direction : Patrick MarcelAdriana Marotta
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 02/12/2019
Etablissement(s) : Tours en cotutelle avec UNIVERSITÉ DE LA RÉPUBLIQUE (UdelaR)
Ecole(s) doctorale(s) : Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes - MIPTIS
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique Fondamentale et Appliquée de Tours

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L'importance de la qualité des données et mondialement reconnue (les problèmes de qualité des données coutent plus d'un trillion de dollars par an aux entreprise des USA ; 30% des leaders des grandes entreprises n'ont pas confiance en leurs données ; etc.). Si les principaux investissements ont d'abords concerné les applications financières et la gestion de la relation client (CRM), aujourd'hui l'attention est portée sur le passage à l'échelle (big data), sur la découverte et l'intégration de nouvelles sources de données aux formats diverses et sur l'évaluation de la véracité des informations sous-jacentes. La qualité des données ouvertes (open data) est un challenge, surtout dans les applications de gouvernement numérique (e-government). Les initiatives gouvernementales, visant à publier leurs données afin d'assurer la transparence de leurs services, sont de plus en plus nombreuses. Plusieurs pays (ex. Angleterre, Canada, Estonie, Irlande) sont très avancés dans le traitement des données publiques pour le gouvernement électronique et visent une démarche 100% open data. Les données issues des services publiques ont des caractéristiques particulières. Elles sont plutôt statistiques, confidentielles (santé, fiscal, etc.), fortement géo-référencées, et sont souvent dupliquées et contradictoires (car provenant d'une variété d'applications et de services) proviennent d'une variété d'applications et de services qui sont souvent dupliqués et contradictoires. Leur publication comme données ouvertes n'est possible qu'au prix de lourds traitements visant à évaluer et garantir leur qualité. En plus, les utilisateurs de ces systèmes sont très variés, allant des fonctionnaires (avec différents niveaux de formation et responsabilité) jusqu'aux citoyens (utilisateurs des applications). En conséquence, le contexte applicatif, concernant tant les utilisateurs que la tâche à accomplir, est très important et ouvre de nouveaux verrous. Cette thèse a pour objectif la proposition d'un framework de gestion de la qualité qui permette la prise en compte des contextes tout au long du cycle de vie de la donnée. Les propositions seront expérimentées dans le cadre de plusieurs agences d'e-gouvernement.