Thèse soutenue

Alignement incrémental de données hétérogènes et dynamiques pour l'aide à la décision

FR  |  
EN
Auteur / Autrice : Oumaima El Haddadi
Direction : Max ChevalierAhmad El Allaoui
Type : Thèse de doctorat
Discipline(s) : Informatique et Télécommunications
Date : Soutenance le 05/07/2025
Etablissement(s) : Université de Toulouse (2023-....) en cotutelle avec Université Abdelmalek Essaâdi (Tétouan, Maroc)
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....) - Institut de recherche en informatique de Toulouse / IRIT
Etablissement de délivrance conjointe : Université de Toulouse (EPE ; 2025-....)
Jury : Président / Présidente : Noura Aknin
Examinateurs / Examinatrices : Noura Aknin, Sara Koulali, Yousef Farhaoui
Rapporteurs / Rapporteuses : Davy Monticolo, Abdelhadi Fennan, Mohamed Benattou

Résumé

FR  |  
EN

A l'ère du Big Data, où les données sont massives et leur complexité croissante, le besoin en informations reste crucial pour chaque organisation. En effet, qu'il s'agisse d'informations collectées sur l'environnement direct (clients, fournisseurs, concurrents...) ou des informations qu'elle a elle-même générées, celles-ci représentent un capital que l'organisation doit exploiter pour rester performante. C'est pourquoi les décideurs doivent prendre, au moment opportun, les meilleures décisions. Dans ce cadre, les systèmes d'aide à la décision visent à les aider à analyser l'ensemble de ces données afin de faciliter et de guider leurs choix stratégiques. Du point de vue du système d'information, deux perspectives peuvent être identifiées : la première concerne l'intégration des données (entrepôts de données, silos...) qui vise à rassembler toutes les données nécessaires à la prise de décision dans un même espace homogène. La seconde vise à stocker les données de manière brute dans un même espace qui lui sera, par nature, hétérogène. Quelle que soit la perspective choisie, un des grands enjeux reste l'alignement des données. En effet, l'alignement permet d'établir des correspondances entre les données disponibles dans l'organisation afin de mieux les intégrer, les cataloguer et plus globalement mieux les exploiter pour l'aide à la décision. Dans les environnements dynamiques dans lesquels les organisations se retrouvent, une double problématique impacte les performances des approches d'alignement de données. En effet, dans ces environnements les données exploitées par l'organisation peuvent être à la fois hétérogènes (la diversité des données et de leur structure) et dynamiques (évolution dans le temps du contenu et des structures des données, apparition de nouvelles sources de données). De multiples approches d'alignement de données ont été proposées dans la littérature. Toutefois ces travaux s'intéressent exclusivement, à notre connaissance, à la problématique de l'hétérogénéité de données. Cependant, ces travaux ne prennent pas en compte la problématique liée à la dynamique des données. En réponse à cela, l'objectif de nos travaux dans cette thèse est de considérer la dynamique des données pour améliorer leurs alignements dans les environnements dynamiques. Or, la problématique de la dynamique des données a été explorée dans des domaines autres que l'alignement. Parmi eux, on trouve la gestion des flux de données et les réseaux dynamiques. Diverses solutions ont émergé pour répondre à ces défis. Par exemple, les graphes dynamiques permettent de représenter et de maintenir les relations évolutives entre les entités. Ils offrent une approche efficace pour modéliser des systèmes en constante mutation. Parallèlement, les mises à jour en flux proposent des mécanismes pour traiter les données en temps réel. Elles éliminent ainsi la nécessité de recalculs globaux. Plus récemment, les techniques de plongement dynamiques se sont distinguées. Elles capturent des relations complexes tout en permettant une mise à jour progressive. Ces approches répondent aux besoins croissants des environnements où les données évoluent rapidement. Ces travaux nous ont inspiré pour concevoir et développer l'approche incrémentale d'alignement de données, nommée 'IDAGEmb', que nous proposons. Cette contribution originale dans le contexte de l'aide à la décision est basée sur des plongements dynamiques de graphe. Cette contribution considère la nature évolutive des données en actualisant progressivement les alignements tout en minimisant les ressources nécessaires au calcul de ces derniers. Les résultats obtenus dans nos expérimentations soulignent l'intérêt de l'alignement incrémental pour l'aide à la décision dans des environnements fortement dynamiques. Nous proposons une solution concrète pour améliorer le calcul des alignements de données, l'analyse des données et le processus globale de prise de décision.