Thèse en cours

Prévision de nouveaux liens dans les réseaux d’interactions bipartis : application au calcul de recommandation

FR

Accès à la thèse

Triangle exclamation pleinLa soutenance a eu lieu le 19/12/2011. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Nasserin Bechettara
Direction : Céline Rouveirol
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 25/01/2008
Soutenance le 19/12/2011
Etablissement(s) : Paris 13
Ecole(s) doctorale(s) : Galilée

Résumé

FR

Dans cette thèse, nous étudions le problème de la prévision d’apparition de nouveaux liens dans les réseaux d’interactions, Nous nous intéressons en par-ticulier aux réseaux dynamiques ayant une structure bipartite. Nous propo Sons un modèle de prévision de liens utilisant les techniques d’apprentissage automatique supervisé. Le problème de prévision de liens est considéré dansce cas comme un problème de classification binaire. Notre approche applique un schéma de propositionnalisation où chaque paire de noeuds est décrite par un ensemble d’attributs représentant des mesures topologiques. Ces mesures sont calculées dans le graphe biparti et dans les graphes projetés qui en découlent. Nous montrons que ces nouvelles similarités dites « indirectes » apportent un gain d’information bénéfique par rapport aux seules similarités directes. Cette thèse apporte aussi de nouvelles solutions au problème de déséqui libre des données dû à la disproportion inhérente entre le nombre de liens qui peuvent se former et le nombre de liens qui se forment réellement. Nous pro- posons tout d’abord d’utiliser des méthodes de soue-échantillonnage informé pour réduire le déséquilibre. Une deuxième solution au niveau algorithmique consiste en une approche d’apprentissage semi-supervisé. Dans ce cas, le problème de prévision de liens est vu comme un problème d’apprentissage à partir d’un ensemble d’instances étiquetées (classe minoritaire) et un en- semble d’instances non-étiquetées (classe majoritaire) . Nous montrons que cette nouvelle approche permet d’améliorer les performances du classifieur sur la classe minoritaire. Les différentes approches proposées sont appliquées sur les données réelles dans le cadre de deux applications : recommandation de collaborations aca démiques et recommandation de produits dans un site de vente de musique en ligne.