Thèse soutenue

Factorisation informées de matrice pour la séparation de sources non-négatives

FR  |  
EN
Auteur / Autrice : Robert Chreiky
Direction : Gilles RousselAntoine AbcheGilles Delmaire
Type : Thèse de doctorat
Discipline(s) : Automatique, Génie informatique, Traitement du signal et des images
Date : Soutenance le 19/12/2017
Etablissement(s) : Littoral en cotutelle avec Université de Balamand (Tripoli, Liban)
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur (Lille)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique, signal et image de la Côte d'Opale (Calais, Pas de Calais) - Laboratoire d'Informatique Signal et Image de la Côte d'Opale / LISIC
Jury : Président / Présidente : Dominique Courcot
Examinateurs / Examinatrices : Gilles Roussel, Antoine Abche, Gilles Delmaire, Stéphane Canu, Chaouki Diab, Nancy Bertin, Elie Karam, Nazih Moubayed
Rapporteur / Rapporteuse : Stéphane Canu, Chaouki Diab

Résumé

FR  |  
EN

Le démélange de sources pour la pollution de l'air peut être formulé comme un problème de NMF en décomposant la matrice d'observation X en le produit de deux matrices non négatives G et F, respectivement la matrice de contributions et de profils. Généralement, les données chimiques sont entâchées d'une part de données aberrantes. En dépit de l'intérêt de la communauté pour les méthodes de NMF, elles souffrent d'un manque de robustesse à un faible nombre de données aberrantes et aux conditions initiales et elles fournissent habituellement de multiples minimas. En conséquence, cette thèse est orientée d'une part vers les méthodes de NMF robustes et d'autre part vers les NMF informées qui utilisent une connaissance experte particulière. Deux types de connaissances sont introduites dans la matrice de profil F. La première hypothèse est la connaissance exacte de certaines composantes de la matrice F tandis que la deuxième information utilise la propriété de somme-à-1 de chaque ligne de la matrice F. Une paramétrisation qui tient compte de ces deux informations est développée et des règles de mise à jour dans le sous-espace des contraintes sont proposées. L'application cible qui consiste à identifier les sources de particules dans l'air dans la région côtière du nord de la France montre la pertinence des méthodes proposées. Dans la série d'expériences menées sur des données synthétiques et réelles, l'effet et la pertinence des différentes informations sont mises en évidence et rendent les résultats de factorisation plus fiables.