Plateforme visuelle pour l'intégration de données faiblement structurées et incertaines
Auteur / Autrice : | Paulo Da Silva Carvalho |
Direction : | Gilles Venturini, Fatma Bouali |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 19/12/2017 |
Etablissement(s) : | Tours |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire) |
Partenaire(s) de recherche : | Equipe de recherche : Laboratoire d'Informatique Fondamentale et Appliquée de Tours (2012-...) |
Laboratoire : École polytechnique universitaire (Tours) | |
Jury : | Président / Présidente : Salima Benbernou |
Examinateurs / Examinatrices : Benoît Otjacques | |
Rapporteurs / Rapporteuses : Cyril de Runz |
Mots clés
Mots clés contrôlés
Résumé
Nous entendons beaucoup parler de Big Data, Open Data, Social Data, Scientific Data, etc. L’importance qui est apportée aux données en général est très élevée. L’analyse de ces données est importante si l’objectif est de réussir à en extraire de la valeur pour pouvoir les utiliser. Les travaux présentés dans cette thèse concernent la compréhension, l’évaluation, la correction/modification, la gestion et finalement l’intégration de données, pour permettre leur exploitation. Notre recherche étudie exclusivement les données ouvertes (DOs - Open Data) et plus précisément celles structurées sous format tabulaire (CSV). Le terme Open Data est apparu pour la première fois en 1995. Il a été utilisé par le groupe GCDIS (Global Change Data and Information System) (États-Unis) pour encourager les entités, possédant les mêmes intérêts et préoccupations, à partager leurs données [Data et System, 1995]. Le mouvement des données ouvertes étant récent, il s’agit d’un champ qui est actuellement en grande croissance. Son importance est actuellement très forte. L’encouragement donné par les gouvernements et institutions publiques à ce que leurs données soient publiées a sans doute un rôle important à ce niveau.