Thèse soutenue

FR
Auteur / Autrice : Ahmad El Ahdab
Direction : Marc Le Goc
Type : Thèse de doctorat
Discipline(s) : Génie informatique et automatique
Date : Soutenance en 2010
Etablissement(s) : Aix-Marseille 3

Mots clés

FR

Résumé

FR

Cette thèse aborde le problème de l'apprentissage de réseaux bayésiens à partir de données datées, sans connaissances a priori du processus dynamique à l'origine des données. Une des principales difficultés de l'apprentissage d'un réseau bayésien est la construction et l'orientation des arcs du réseau tout en évitant les boucles. Cette difficulté augmente significativement lorsque les données sont datées. Ce mémoire propose un algorithme, appelé BJT4BN, basé sur une représentation adéquate d'un ensemble de séquences d'observations datées et utilise la BJ-mesure, une mesure de la théorie de l'information adaptée aux données datées, pour évaluer le flux d'information circulant le long d'un arc. Cet algorithme et cette mesure ont été conçus dans le cadre du processus TOM4L (Timed Observations Mining for Leaming), fondé sur la théorie des observations datées. Les travaux présentés dans ce mémoire sont illustrés sur l'exemple pédagogique du diagnostic d'un véhicule automobile. Le caractère opérationnel des travaux sont décrit à partir des résultats obtenus à partir des données du système Apache, le système à bases de connaissances développé par le groupe Arcelor Mittal Steel Group pour piloter ses bains de galvanisation.