Thèse soutenue

Contribution à la découverte de sous-groupes corrélés : Application à l’analyse des systèmes territoriaux et des réseaux alimentaires

FR  |  
EN
Auteur / Autrice : Mohamed Ali Hammal
Direction : Céline Robardet
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 05/06/2020
Etablissement(s) : Lyon
Ecole(s) doctorale(s) : École doctorale en Informatique et Mathématiques de Lyon (2009-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : Institut national des sciences appliquées (Lyon ; 1957-....)
Laboratoire : LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Rhône ; 2003-....) - Laboratoire d'InfoRmatique en Image et Systèmes d'information / LIRIS
Equipe de recherche : Data Mining and Machine Learning
Jury : Président / Présidente : Christine Largeron
Examinateurs / Examinatrices : Céline Robardet, Christine Largeron, Dino Ienco, Alexandre Termier, Luc Merchez, Benjamin Negrevergne
Rapporteurs / Rapporteuses : Dino Ienco, Alexandre Termier

Résumé

FR  |  
EN

Mieux nourrir les villes en quantité et en qualité, notamment les grandes agglomérations, constitue un défi majeur dont la résolution passe par une meilleure compréhension des relations entre les populations urbaines et leur alimentation. A l’échelle des systèmes alimentaires urbains, on a besoin de diagnostics ciblant la disponibilité des ressources alimentaires croisée avec les profils socio-économiques des territoires et l’on manque d’outils et de méthodes pour appréhender de façon systématique les relations entre les bassins de consommation, l’offre et les comportements alimentaires. L’objectif de cette thèse est de contribuer à l’élaboration de nouveaux outils informatiques pour traiter des données temporelles, hétérogènes et multi-sources afin d’identifier et de caractériser des comportements propres à une zone géographique. Pour cela, nous nous appuyons sur l’exploration conjointe de motifs graduels, identifiant des corrélations de rang, et de sous-groupes afin de découvrir des contextes pour lesquels les corrélations décrites par les motifs graduels sont exceptionnellement fortes par rapport au reste des données. Nous proposons un algorithme d’énumération s’appuyant sur des propriétés d’élagage avec des bornes supérieures, ainsi qu’un autre algorithme qui échantillonne les motifs selon la mesure de qualité. Ces approches sont validées non seulement sur des jeux de données de référence, mais aussi à travers une étude empirique de laformation des déserts alimentaires sur l’agglomération lyonnaise.