Apprentissage renforcé appliqué à l'évaluation de la résilience d'un Système Homme-Machine face à des situations critiques
Auteur / Autrice : | Kiswendsida Abel Ouedraogo |
Direction : | Frédéric Vanderhaegen, Simon Enjalbert |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique. Automatique, Génie informatique |
Date : | Soutenance le 14/02/2013 |
Etablissement(s) : | Valenciennes |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur (Lille) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'automatique, de mécanique et d'informatique industrielles et humaines (Valenciennes, Nord ; 1994-...) |
Pôle de recherche et d'enseignement supérieur (PRES) : Communauté d'universités et d'établissements Lille Nord de France (2009-2013) | |
Jury : | Président / Présidente : Gilles Coppin |
Examinateurs / Examinatrices : Frédéric Vanderhaegen, Simon Enjalbert, Bernard Grabot, Peter Wieringa, Oliver Carsten | |
Rapporteurs / Rapporteuses : Bernard Grabot, Peter Wieringa |
Mots clés
Résumé
Nous définissons la résilience comme la capacité d’un Système Homme-Machine (SHM) à s’adapter positivement face à des situations critiques engendrées par des évènements sans précédent dont la fréquence d’occurrence est invraisemblable et dont les conséquences sur le système sont critiques voire catastrophiques.Nous présentons d’abord un état de l’art reposant sur le concept de résilience que nous positionnons par rapport aux approches classiques de la sureté de fonctionnement pour l’évaluation et la gestion des risques dans les SHM. Nous présentons ensuite des méthodes et des outils d’aide à la réaction et à la récupération des systèmes face à l’imprévu. Nous nous intéresserons également à l’apport des techniques d’apprentissage itératif pour le management de la résilience des SHM. Nous proposons alors une méthode d’évaluation de la résilience basée sur un couple d’indicateurs multicritères. Un estimateur reposant sur un réseau de neurones à apprentissage renforcé est proposé pour évaluer les indicateurs derésilience non mesurables ‘‘en ligne’’. Pour fiabiliser l’estimation, nous proposons unapprentissage itératif associé soit à un renforcement des paramètres d’estimation, soit à un renforcement de la base de connaissances, soit les deux simultanément.Nous appliquons nos propositions lors d’une simulation de vol d’un Groupe de Ravitaillement en Vol, composé d’un équipage tournant de 4 personnes. L’analyse des résultats expérimentaux montre la pertinence de nos contributions. Certaines perspectives de recherche sont ensuite abordées notamment l’extension de l’étude aux événements de criticité moindre et dont on disposerait d’une base de connaissances « experte ».