Thèse soutenue

Fouille de données spatio-temporelles, résumés de données et apprentissage automatique : application au système de recommandations touristique, données médicales et détection des transactions atypiques dans le domaine financier

FR  |  
EN
Auteur / Autrice : Erol Elisabeth
Direction : Serge Agostinelli
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 06/04/2021
Etablissement(s) : Antilles
Ecole(s) doctorale(s) : École doctorale Milieu insulaire tropical à risques : protection, valorisation , santé et développement (Pointe-à-Pitre)
Partenaire(s) de recherche : Equipe de recherche : Laboratoire de Mathématiques Informatique et Applications
Jury : Examinateurs / Examinatrices : Serge Agostinelli, Pierre-Michel Riccio, Christophe Alcantara, Claudine Batazzi, Christine Poplimont, Maximilian Hasler

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La fouille de données est une des composantes Gestion de la Relation Client (CRM) largement déployée dans les entreprises. Ce processus s’appuie sur des algorithmes issus de disciplines scientifiques diverses (statistiques, intelligence artificielle, base de données) pour construire des modèles à partir des données.L’objectif de déterminer des modèles, établis à partir de clusters au service de l’amélioration de la connaissance du client au sens générique, de la prédiction de ses comportements et de l’optimisation de l’offre proposée. Ces modèles ayant vocation à être utilisés par des utilisateurs spécialistes du domaine de données, chercheurs en économie de la santé et sciences de gestion ou professionnels du secteur étudié, ces travaux de recherche mettent l’accent sur l’utilisabilité des environnements de fouille de données. Cette thèse s’intéresse à la fouille de données spatio-temporelle. Elle met particulièrement en évidence une approche originale pour le traitement des données avec un but d’enrichissement des connaissances pratiques du domaine. Ce travail comporte un volet applicatif en quatre chapitres qui correspond à quatre systèmes développés:- Un modèle pour la mise place d’un système de recommandation basé sur la collecte de données de positionnement GPS,- Un outil de résumé de données optimisé pour la rapidité des réponses aux requêtes au programme de médicalisation des systèmes d’information (PMSI),- Un outil d’apprentissage automatique pour la lutte contre le blanchiment dans le système financier,- Un modèle pour la prédiction d’activité dans les TPE qui sont météo-dépendantes (tourisme, transport, loisirs, commerce, etc.). Le problème est ici d’identifier les algorithmes de classification et de réseaux de neurones en vue d’une analyse de données dont le but est d’adapter la stratégie de l’entreprise aux mouvements conjoncturels.