Thèse soutenue

Modèles à blocs stochastiques, classifications et applications

FR  |  
EN
Auteur / Autrice : Abir El Haj
Direction : Yousri SlaouiZaher KhraibaniPierre-Yves Louis
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 29/11/2019
Etablissement(s) : Poitiers en cotutelle avec Université Libanaise
Ecole(s) doctorale(s) : École doctorale Sciences et Ingénierie des Systèmes, Mathématiques, Informatique (Limoges ; 2018-2022)
Partenaire(s) de recherche : Laboratoire : Laboratoire de mathématiques et applications - LMA (Poitiers) - Laboratoire de Mathématiques et Applications / LMA-Poitiers
faculte : Université de Poitiers. UFR des sciences fondamentales et appliquées
Jury : Président / Présidente : Ghislaine Gayraud
Examinateurs / Examinatrices : Yousri Slaoui, Zaher Khraibani, Pierre-Yves Louis, Mohammad Kacim, Joseph Ngatchou Wandji
Rapporteurs / Rapporteuses : Stéphane Robin, Sophie Donnet

Résumé

FR  |  
EN

Cette thèse de doctorat porte sur l’analyse de réseaux pondérés, graphes finis où chaque arête est associée à un poids représentant l’intensité de sa force. Nous introduisons une extension du modèle à blocs stochastiques (SBM) binaire, appelée modèle à blocs stochastiques binomial (bSBM). Cette question est motivée par l’étude des réseaux de co-citations dans un contexte de fouille de textes où les données sont représentées par un graphe. Les noeuds sont des mots et chaque arête joignant deux mots est pondérée par le nombre de documents inclus dans le corpus citant simultanément cette paire de mots. Nous développons une méthode d’inférence basée sur l’algorithme espérance maximisation variationnel (EMV) pour estimer les paramètres du modèle proposé ainsi que pour classifier les mots du réseau. Puis nous adoptons une méthode qui repose sur la maximisation d’un critère ICL (en anglais integrated classification likelihood) pour sélectionner le modèle optimal et le nombre de clusters. D’autre part, nous développons une approche variationnelle pour traiter le réseau et nous comparons les deux approches. Des applications à des données réelles sont adoptées pour montrer l’efficacité des deux méthodes ainsi que pour les comparer. Enfin, nous développons un SBM avec plusieurs attributs pour traiter les réseaux ayant des poids associés aux noeuds. Nous motivons cette méthode par une application qui vise au développement d’un outil d’aide à la spécification de différents traitements cognitifs réalisés par le cerveau lors de la préparation à l’écriture.