Thèse soutenue

Intégration des biais de langage à l'algorithme générer-et-tester : contributions à l'apprentissage disjonctif
FR
Accès à la thèse
Auteur / Autrice : Fabien Torre
Direction : Yves Kodratoff
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2000
Etablissement(s) : Paris 11

Mots clés

FR

Résumé

FR

Cette thèse se situe en intelligence artificielle et plus particulièrement en apprentissage automatique. Elle est constituée de deux parties. La première a pour but d'intégrer les biais de langage, et plus généralement toutes les propriétés connues de la solution, dans l'algorithme générer-et-tester appliqué à la programmation logique inductive. L'ensemble de ce travail d'intégration repose sur notre notion de propriété privée qui caractérise les associations propriété-opérateur pour lesquelles un élagage dynamique est sans risque. Nous nous interrogeons alors sur la nature des opérateurs et plus généralement des relations qui rendent une propriété privée : tous sont inclus dans ce que nous avons nommé la relation naturelle de la propriété. Nous montrons ensuite que certaines de ces relations contiennent des opérateurs idéaux alors qu'il est établi qu'il n'en existe pas dans le cadre habituel de la programmation logique inductive. Nous terminons avec une intégration des biais à tous les niveaux de l'algorithme générer-et-tester : relation de généralite (naturelle), bases de la recherche, parcourabilité, complétude, optimalité, opérateur parfait. La seconde partie s'intéresse aux cas où le concept recherche ne peut pas être décrit par une unique hypothèse : il faut recourir à une disjonction d'hypothèses. Nous décrivons les difficultés d'un tel apprentissage et montrons l'inefficacité des méthodes présentées dans la première partie. Cela nous amène à préciser notre objectif : former des paquets d'exemples maximalement corrects et en nombre minimal permettant la couverture des exemples positifs. Dans ce cadre, nous proposons deux solutions : le système stochastique GloBo capable d'évaluer l'adéquation entre les données et la solution proposée, et les Vraizamis, un système d'éco-résolution. Enfin, nous décrivons des expérimentations qui valident ces approches.