Thèse soutenue

Apprentissage statistique relationnel : apprentissage de structures de réseaux de Markov logiques

FR  |  
EN
Auteur / Autrice : Quang-Thang Dinh
Direction : Christel VrainMatthieu Exbrayat
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 28/11/2011
Etablissement(s) : Orléans
Ecole(s) doctorale(s) : École doctorale Sciences et technologies (Orléans ; 2009-2012)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique fondamentale d'Orléans (Orléans ; 1987-....) - Laboratoire d'Informatique Fondamentale d'Orléans
Jury : Président / Présidente : Philippe Leray
Examinateurs / Examinatrices : Christel Vrain, Matthieu Exbrayat, Philippe Leray, Lorenza Saitta, Céline Rouveirol, Patrick Gallinari
Rapporteurs / Rapporteuses : Lorenza Saitta, Céline Rouveirol

Résumé

FR  |  
EN

Un réseau logique de Markov est formé de clauses en logique du premier ordre auxquelles sont associés des poids. Cette thèse propose plusieurs méthodes pour l’apprentissage de la structure de réseaux logiques de Markov (MLN) à partir de données relationnelles. Ces méthodes sont de deux types, un premier groupe reposant sur les techniques de propositionnalisation et un second groupe reposant sur la notion de Graphe des Prédicats. L’idée sous-jacente aux méthodes à base de propositionnalisation consiste à construire un jeu de clauses candidates à partir de jeux de littéraux dépendants. Pour trouver de tels jeux, nous utilisons une méthode de propositionnalisation afin de reporter les informations relationnelles dans des tableaux booléens, qui serviront comme tables de contingence pour des test de dépendance. Nous avons proposé deux méthodes de propositionnalisation, pour lesquelles trois algorithmes ont été développés, qui couvrent les problèmes d’appprentissage génératif et discriminant. Nous avons ensuite défini le concept de Graphe des Prédicats qui synthétise les relations binaires entre les prédicats d’un domaine. Des clauses candidates peuvent être rapidement et facilement produites en suivant des chemins dans le graphe puis en les variabilisant. Nous avons développé deux algorithmes reposant sur les Graphes des Prédicats, qui couvrent les problèmes d’appprentissage génératif et discriminant.