De l'identification de structure de réseaux bayésiens à la reconnaissance de formes à partir d'informations complètes ou incomplètes
Auteur / Autrice : | Olivier François |
Direction : | Stéphane Canu |
Type : | Thèse de doctorat |
Discipline(s) : | Génie informatique et traitement du signal |
Date : | Soutenance en 2006 |
Etablissement(s) : | Rouen, INSA |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...) |
Mots clés
Résumé
Durant ces travaux de thèse, une comparaison empirique de différentes techniques d'apprentissage de structure de réseaux bayésiens a été effectuée, car même s'il peut en exister très ponctuellement, il n'existe pas de comparaisons plus globales de ces algorithmes. De multiples phases de tests nous ont permis d'identifier quelles méthodes souffraient de difficultés d'initialisation et nous avons proposé une technique pour les résoudre. Nous avons ensuite adapté différentes méthodes d'apprentissage de structure aux bases de données incomplètes et avons notamment introduit une technique pour apprendre efficacement une structure arborescente. Cette méthode est ensuite adaptée à la problématique plus spécifique de la classification et permet d'apprendre efficacement et en toute généralité un classifieur de Bayes Naïf augmenté. Un formalisme original permettant de générer des bases de données incomplètes ayant des données manquantes vérifiant les hypothèses MCAR ou MAR est également introduit. De nombreuses bases synthétiques ou réelles ont alors été utilisées pour tester ces méthodes d'apprentissage de structure à partir de bases incomplètes.