Factorisation informées de matrice pour la séparation de sources non-négatives
Auteur / Autrice : | Robert Chreiky |
Direction : | Gilles Roussel, Antoine Abche, Gilles Delmaire |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique, Génie informatique, Traitement du signal et des images |
Date : | Soutenance le 19/12/2017 |
Etablissement(s) : | Littoral en cotutelle avec Université de Balamand (Tripoli, Liban) |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur (Lille) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique, signal et image de la Côte d'Opale (Calais, Pas de Calais) - Laboratoire d'Informatique Signal et Image de la Côte d'Opale / LISIC |
Jury : | Président / Présidente : Dominique Courcot |
Examinateurs / Examinatrices : Gilles Roussel, Antoine Abche, Gilles Delmaire, Stéphane Canu, Chaouki Diab, Nancy Bertin, Elie Karam, Nazih Moubayed | |
Rapporteur / Rapporteuse : Stéphane Canu, Chaouki Diab |
Résumé
Le démélange de sources pour la pollution de l'air peut être formulé comme un problème de NMF en décomposant la matrice d'observation X en le produit de deux matrices non négatives G et F, respectivement la matrice de contributions et de profils. Généralement, les données chimiques sont entâchées d'une part de données aberrantes. En dépit de l'intérêt de la communauté pour les méthodes de NMF, elles souffrent d'un manque de robustesse à un faible nombre de données aberrantes et aux conditions initiales et elles fournissent habituellement de multiples minimas. En conséquence, cette thèse est orientée d'une part vers les méthodes de NMF robustes et d'autre part vers les NMF informées qui utilisent une connaissance experte particulière. Deux types de connaissances sont introduites dans la matrice de profil F. La première hypothèse est la connaissance exacte de certaines composantes de la matrice F tandis que la deuxième information utilise la propriété de somme-à-1 de chaque ligne de la matrice F. Une paramétrisation qui tient compte de ces deux informations est développée et des règles de mise à jour dans le sous-espace des contraintes sont proposées. L'application cible qui consiste à identifier les sources de particules dans l'air dans la région côtière du nord de la France montre la pertinence des méthodes proposées. Dans la série d'expériences menées sur des données synthétiques et réelles, l'effet et la pertinence des différentes informations sont mises en évidence et rendent les résultats de factorisation plus fiables.