Thèse soutenue

Découverte interactive de connaissances à partir de traces d’activité : Synthèse d’automates pour l’analyse et la modélisation de l’activité de conduite automobile

FR  |  
EN
Auteur / Autrice : Benoît Mathern
Direction : Alain Mille
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 12/03/2012
Etablissement(s) : Lyon 1
Ecole(s) doctorale(s) : École doctorale en Informatique et Mathématiques de Lyon
Jury : Examinateurs / Examinatrices : Pierre Deransart, Thierry Bellet
Rapporteurs / Rapporteuses : Guy Boy, Fabien Gandon, Catherine Garbay

Résumé

FR  |  
EN

Comprendre la genèse d’une situation de conduite requiert d’analyser les choixfaits par le conducteur au volant de son véhicule pendant l’activité de conduite, dans sacomplexité naturelle et dans sa dynamique située. Le LESCOT a développé le modèleCOSMODRIVE, fournissant un cadre conceptuel pour la simulation cognitive de l’activitéde conduite automobile. Pour exploiter ce modèle en simulation, il est nécessairede produire les connaissances liées à la situation de conduite sous forme d’un automatepar exemple. La conception d’un tel automate nécessite d’une part de disposer de donnéesissues de la conduite réelle, enregistrées sur un véhicule instrumenté et d’autrepart d’une expertise humaine pour les interpréter.Pour accompagner ce processus d’ingénierie des connaissances issues de l’analysed’activité, ce travail de thèse propose une méthode de découverte interactive deconnaissances à partir de traces d’activité. Les données de conduite automobile sontconsidérées comme des M-Traces, associant une sémantique explicite aux données,exploitées en tant que connaissances dans un Système à Base de Traces (SBT). Le SBTpermet de filtrer, transformer, reformuler et abstraire les séquences qui serviront à alimenterla synthèse de modèles automates de l’activité de conduite. Nous reprenons destechniques de fouille de workflow permettant de construire des automates (réseaux dePetri) à partir de logs. Ces techniques nécessitent des données complètes ou statistiquementreprésentatives. Or les données collectées à bord d’un véhicule en situationde conduite sont par nature des cas uniques, puisqu’aucune situation ne sera jamaisreproductible à l’identique, certaines situations particulièrement intéressantes pouvanten outre être très rarement observées. La gageure est alors de procéder à une forme degénéralisation sous la forme de modèle, à partir d’un nombre de cas limités, mais jugéspertinents, représentatifs, ou particulièrement révélateurs par des experts du domaine.Pour compléter la modélisation de telles situations, nous proposons donc de rendreinteractifs les algorithmes de synthèse de réseau de Petri à partir de traces, afin depermettre à des experts-analystes de guider ces algorithmes et de favoriser ainsi la découvertede connaissances pertinentes pour leur domaine d’expertise. Nous montreronscomment rendre interactifs l’algorithme α et l’algorithme α+ et comment généralisercette approche à d’autres algorithmes.Nous montrons comment l’utilisation d’un SBT et de la découverte interactived’automates impacte le cycle général de découverte de connaissances. Une méthodologieest proposée pour construire des modèles automates de l’activité de conduiteautomobile.Une étude de cas illustre la méthodologie en partant de données réelles de conduiteet en allant jusqu’à la construction de modèles avec un prototype logiciel développédans le cadre de cette thèse