Thèse soutenue

Apprentissage inductif en presence de donnees imprecises : construction et utilisation d'arbres de decision flous

FR
Auteur / Autrice : Christophe Marsala
Direction : Bernadette Bouchon-Meunier
Type : Thèse de doctorat
Discipline(s) : Sciences et techniques
Date : Soutenance en 1998
Etablissement(s) : Paris 6

Résumé

FR

Dans cette these, on propose d'etendre les methodes d'apprentissage inductif par arbres de decision en utilisant la theorie des sous-ensembles flous pour la prise en compte des imprecisions dans les donnees. Une formalisation des algorithmes de construction d'arbres de decision est introduite, et permet d'exhiber les parametres fondamentaux a modifier pour une telle prise en compte, et construire ainsi un arbre de decision flou. Une methode d'utilisation de tels arbres pour le classement d'objets inconnus est donnee. Elle est basee sur l'utilisation d'une mesure de satisfiabilite pour evaluer la ressemblance des valeurs du nouvel objet et des modalites presentes dans les tests des noeuds de l'arbre. Une etude de la stabilite de cette methode d'inference a partir de donnees floues est faite afin de faire ressortir la robustesse en terme de decision d'un tel systeme. Ces methodes de construction et d'utilisation d'arbres de decision flous ont donne lieu a la realisation du programme informatique salammbo. Afin de faciliter la phase de discretisation des donnees, on propose une methode automatique de construction d'une partition floue sur un ensemble de valeurs des attributs numeriques-symboliques. Elle est basee sur l'utilisation des operateurs de la theorie de la morphologie mathematique formalises a l'aide de la theorie des langages formels. L'application tanit a ensuite ete realisee pour construire une foret d'arbres de decision flous basee sur l'utilisation de plusieurs salammbo, executes de facon parallele, chacun devant apprendre a ne reconnaitre que deux classes. Une methode d'etude des mesures de discrimination utilisees dans la construction d'un arbre de decision a ete introduite. Elle permet de valider une mesure pour verifier son adequation a mesurer le pouvoir discriminant d'un attribut, d'en construire de nouvelles et de faciliter l'introduction des elements de la theorie des sous-ensembles flous pour prendre en compte l'imprecision des donnees.