Thèse soutenue

Les modèles probalistes relationnels : apprentissage et évaluation. Cas des réseaux bayésiens relationnels@

FR  |  
EN
Auteur / Autrice : Mouna Ben Ishak
Direction : Philippe LerayNahla Ben Amor
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2015
Etablissement(s) : Nantes en cotutelle avec Le Bardo (Tunisie)
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et mathématiques (Nantes)
Partenaire(s) de recherche : Laboratoire : Laboratoire d’Informatique de Nantes Atlantique (UMR 6241) (Nantes) - Laboratoire de Recherche Opérationnelle, de Décision et de Contrôle des procédés (LARODEC) (Le Bardo, Tunisie)
autre partenaire : École polytechnique de l'Université de Nantes
Jury : Président / Présidente : Zied Elouedi
Examinateurs / Examinatrices : Philippe Leray, Nahla Ben Amor, Zied Elouedi, Céline Rouveirol, Jérôme Darmont, Pierre-Henri Wuillemin
Rapporteurs / Rapporteuses : Céline Rouveirol, Jérôme Darmont

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

L’apprentissage statistique relationnel est apparu au début des années 2000 comme un nouveau domaine de l’apprentissage machine permettant de raisonner d’une manière efficace et robuste directement sur des structures de données relationnelles. Plusieurs méthodes classiques de fouille de données ont été adaptées pour application directe sur des données relationnelles. Les réseaux Bayésiens Relationnels (RBR) présentent une extension des réseaux Bayésiens (RB) dans ce contexte. Pour se servir de ce modèle, il faut tout d’abord le construire : la structure et les paramètres du RBR doivent être définis à la main ou être appris à partir d’une instance de base de données relationnelle. L’apprentissage de la structure reste toujours le problème le plus compliqué puisqu’il se situe dans la classe des problèmes NP-difficiles. Les méthodes d’apprentissage de la structure des RBR existantes sont inspirées des méthodes classique de l’apprentissage de la structure des RB. Pour pouvoir juger la qualité d’un algorithme d’apprentissage de la structure d’un RBR, il faut avoir des données de test et des mesures d’évaluation. Pour les RB les données sont souvent issues de benchmarks existants. Sinon, des processus de génération aléatoire du modèle et des données sont mis en oeuvre. Les deux pratiques sont quasi absentes pour les RBR. De plus, les mesures d’évaluation de la qualité d’un algorithme d ’apprentissage de la structure d’un RBR ne sont pas encore établies. Dans ce travail de thèse, nous proposons deux contributions majeures. I)Une approche de génération de RBR allant de la génération du schéma relationnel, de la structure de dépendance et des tables de probabilités à l’instanciation de ce modèle et la population d’une base de données relationnelle. Nous discutons aussi de l’adaptation des mesures d’évaluation des algorithmes d’apprentissage de RBs dans le contexte relationnel et nous proposons de nouvelles mesures d’évaluation. II) Une approche hybride pour l’apprentissage de la structure des RBR. Cette approche présente une extension de l’algorithme MMHC dans le contexte relationnel. Nous menons une étude expérimentale permettant de comparer ce nouvel algorithme d’apprentissage avec les approches déjà existantes.