Méthodes d’apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux

Marina Sokol

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Méthodes d’apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux

FR |

EN

Auteur / Autrice :	Marina Sokol
Direction :	Philippe Nain, Paulo Gonçalvès
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 29/04/2014
Etablissement(s) :	Nice
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....)
Partenaire(s) de recherche :	Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) - MAESTRO
Jury :	Président / Présidente : Walid Dabbous
	Examinateurs / Examinatrices : Philippe Nain, Paulo Gonçalvès, Walid Dabbous, Hichem Sahbi, Stefano Leonardi, Ravi Kumar
	Rapporteurs / Rapporteuses : Hichem Sahbi, Stefano Leonardi, Ravi Kumar

Mots clés

FR |

EN

Mots clés contrôlés

Classification automatique

Classification

Poste à poste (Internet)

Apprentissage automatique

Mots clés libres

Apprentissage automatique

Apprentissage semi-supervisé

PageRank

Mesures de centralité

Classification dans les systèmes Pair-à-pair

Résumé

FR |

EN

Les méthodes d'apprentissage semi-supervisé constituent une catégorie de méthodes d'apprentissage automatique qui combinent points étiquetés et données non labellisées pour construire le classifieur. Dans la première partie de la thèse, nous proposons un formalisme d'optimisation général, commun à l'ensemble des méthodes d'apprentissage semi-supervisé et en particulier aux Laplacien Standard, Laplacien Normalisé et PageRank. En utilisant la théorie des marches aléatoires, nous caractérisons les différences majeures entre méthodes d'apprentissage semi-supervisé et nous définissons des critères opérationnels pour guider le choix des paramètres du noyau ainsi que des points étiquetés. Nous illustrons la portée des résultats théoriques obtenus sur des données synthétiques et réelles, comme par exemple la classification par le contenu et par utilisateurs des systèmes pair-à-pair. Cette application montre de façon édifiante que la famille de méthodes proposée passe parfaitement à l’échelle. Les algorithmes développés dans la deuxième partie de la thèse peuvent être appliquées pour la sélection des données étiquetées, mais également aux autres applications dans la recherche d'information. Plus précisément, nous proposons des algorithmes randomisés pour la détection rapide des nœuds de grands degrés et des nœuds avec de grandes valeurs de PageRank personnalisé. A la fin de la thèse, nous proposons une nouvelle mesure de centralité, qui généralise à la fois la centralité d'intermédiarité et PageRank. Cette nouvelle mesure est particulièrement bien adaptée pour la détection de la vulnérabilité de réseau.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Méthodes d’apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Méthodes d’apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses