Thèse soutenue

Avancées en analyse tensorielle et application à la fouille de textes
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Elaheh Sobhani
Direction : Pierre ComonMassoud Babaie-ZadehChristian Jutten
Type : Thèse de doctorat
Discipline(s) : Signal, image, paroles, télécoms
Date : Soutenance le 10/03/2022
Etablissement(s) : Université Grenoble Alpes en cotutelle avec Sharif University of Technology (Tehran)
Ecole(s) doctorale(s) : École doctorale électronique, électrotechnique, automatique, traitement du signal (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Grenoble Images parole signal automatique - Equipe de recherche Géométrie, apprentissage, information et algorithmes (Grenoble)
Jury : Président / Présidente : Laurent Albera
Examinateurs / Examinatrices : Farrokh Marvasti, Sepideh Hajipour Sardouie
Rapporteurs / Rapporteuses : Éric Moreau, Reza Sameni

Résumé

FR  |  
EN

Les tenseurs - ou les tableaux multi-indices - sont des outils utiles pour identifier des quantités inconnues grâce à l'unicité de leur décomposition. Les décompositions tensorielles ont été largement utilisées pour obtenir des composantes inconnues ayant une signification physique dans de nombreuses applications, telles que le traitement d'images et de signaux médicaux, l'analyse d'images hyperspectrales, la chimiométrie, etc.Dans cette thèse, nous étudions l'application de la décomposition tensorielle pour l'estimation de probabilités, qui sont nécessaires pour certaines tâches ciblées de fouille de données/textes telles que le groupement non supervisé de données/documents. En plus de critiquer les algorithmes de décomposition tensorielle utilisés pour l'estimation de probabilités, nous proposons des décompositions tensorielles sous des contraintes appropriées, qui donnent lieu à des estimations plus fiables et plus précises. De plus, nous introduisons un algorithme de décomposition tensorielle contrainte, appelé Simple Forward-Backward Splitting (SFBS), qui est basé sur une approche de minimisation proximale. SFBS est plus performant que l'état de l'art dans la décomposition des tenseurs bruités tout en étant moins coûteux en calcul.En outre, pour évaluer la performance des algorithmes de décomposition tensorielle, nous introduisons un indice appelé CorrIndex, qui fournit des limites de performance interprétables, tout en maintenant la complexité de calcul à un niveau raisonnable. De plus, nous proposons une méthode d'estimation des moments (moyenne standard), qui estime les moments d'ordre deux et trois, avec les mêmes performances que l'état de l'art, mais basée sur un concept beaucoup plus simple, la moyenne pondérée. De plus, le calcul de la moyenne standard est plus performant dans les petites dimensions et n'est pas limité par le nombre minimum de données observées, contrairement à l'état de l'art.Mots clés — Décomposition tensorielle, Fouille de texte, Clustering non-supervisé, Variable cachée/latente, Moment de troisième ordre, Fractionnement avant-arrière,Opérateur proximal, Indice de performance, Ambiguïté d'échelle et de permutation