Thèse soutenue

Approches modèles pour la structuration du web vu comme un graphe

FR  |  
EN
Auteur / Autrice : Hugo Zanghi
Direction : Christophe Ambroise
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 25/06/2010
Etablissement(s) : Evry-Val d'Essonne
Ecole(s) doctorale(s) : Des génomes aux organismes
Jury : Président / Présidente : Patrick Gallinari
Examinateurs / Examinatrices : François Bourdoncle, Franck Ghitalla
Rapporteurs / Rapporteuses : Gérard Govaert, Fabrice Rossi

Mots clés

FR  |  
EN

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

L’analyse statistique des réseaux complexes est une tâche difficile, étant donné que des modèles statistiques appropriés et des procédures de calcul efficaces sont nécessaires afin d’apprendre les structures sous-jacentes. Le principe de ces modèles est de supposer que la distribution des valeurs des arêtes suit une distribution paramétrique, conditionnellement à une structure latente qui est utilisée pour détecter les formes de connectivité. Cependant, ces méthodes souffrent de procédures d’estimation relativement lentes, puisque les dépendances sont complexes. Dans cette thèse nous adaptons des stratégies d’estimation incrémentales, développées à l’origine pour l’algorithme EM, aux modèles de graphes. Additionnellement aux données de réseau utilisées dans les méthodes mentionnées ci-dessus, le contenu des noeuds est parfois disponible. Nous proposons ainsi des algorithmes de partitionnement pour les ensembles de données pouvant être modélisés avec une structure de graphe incorporant de l’information au sein des sommets. Finalement,un service Web en ligne, basé sur le moteur de recherche d’ Exalead, permet de promouvoir certains aspects de cette thèse.