Estimation de probabilité de défaillance et de sa sensibilité locale dans un espace elliptique standard de grande dimension
Auteur / Autrice : | Marie Chiron |
Direction : | Jérôme Morio, Michel Salaün |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques et Applications |
Date : | Soutenance le 04/07/2023 |
Etablissement(s) : | Toulouse, ISAE |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications (Toulouse) |
Partenaire(s) de recherche : | Equipe de recherche : Équipe d'accueil doctoral Modélisation et ingénierie des systèmes (Toulouse, Haute-Garonne) |
Jury : | Président / Présidente : Josselin Garnier |
Examinateurs / Examinatrices : Jérôme Morio, Michel Salaün, Céline Helbert, Carsten Proppe, Cécile Mattrand, Guillaume Perrin, Sylvain Dubreuil | |
Rapporteur / Rapporteuse : Céline Helbert, Carsten Proppe |
Résumé
Dans de nombreuses disciplines scientifiques, un système complexe est souvent modélisé avec une fonction M, supposée simuler le comportement du système. La sortie de cette fonction est la réponse observée tandis que les entrées représentent les différentes variables qui influencent le comportement du système. Le système étant soumis à des aléas, certaines de ses entrées sont des variables aléatoires. Ainsi, la sortie de la fonction est également aléatoire. La défaillance du système correspond à une réponse extrême de la fonction, dont les conséquences sont critiques. Dans un contexte où la fonction M agit comme une boîte noire, le calcul de la probabilité de défaillance et de sa sensibilité locale est crucial pour l'analyse de fiabilité du système. L'estimation de la probabilité de défaillance et de sa sensibilité locale est particulièrement difficile pour des systèmes de grande dimension, dont le domaine de défaillance des entrées possède plusieurs régions de défaillance. Les entrées aléatoires sont modélisées ici avec des distributions elliptiques standards, comme la loi normale standard par exemple. Le comportement de telles distributions en grande dimension doit être pris en compte dans le processus d'estimation. Dans la littérature, de nombreux algorithmes d'échantillonnage préférentiel (EP) ont été spécifiquement adaptés à l'estimation de la probabilité de défaillance de systèmes possédant plusieurs régions de défaillance dans l'espace standard normal de grande dimension. Le but de l'EP est de construire une densité auxiliaire qui génère plus d'observations dans le domaine de défaillance que la densité de probabilité initiale des entrées aléatoires. Afin de prendre en compte la multiplicité des régions de défaillance, la densité auxiliaire est alors construite comme un mélange de densités. Cependant, le nombre de densités dans le mélange, correspondant au nombre de régions de défaillance, doit être fixé a priori et est difficile à paramétrer dans un contexte de boîte noire. De plus, dans l'espace standard elliptique, la sensibilité locale de la probabilité par rapport à une entrée déterministe s'écrit nécessairement comme une intégrale surfacique, dont l'estimation est laborieuse. En conséquence, ces sensibilités sont souvent approchées par un estimateur biaisé plus facile à obtenir, mais dont le biais est difficilement évaluable. Le but de cette thèse est alors d'améliorer l'estimation de la probabilité de défaillance et de sa sensibilité locale dans un tel contexte. L'algorithme proposé pour estimer la probabilité de défaillance repose sur une recherche progressive des régions de défaillance dans l'espace standard elliptique. Pour chaque région de défaillance identifiée, une densité auxiliaire est construite et optimisée de manière adaptative. Cette densité prend en compte le comportement des entrées en grande dimension puisque sa construction bénéficie de leur représentation stochastique. La probabilité de défaillance finale est estimée avec un échantillonnage préférentiel multiple, en utilisant toutes les densités auxiliaires précédemment construites. L'approche proposée pour estimer la sensibilité de la probabilité par rapport aux entrées déterministes repose sur une régression polynomiale hétéroscédastique. En effet, la sensibilité locale est identifiée comme le terme d'ordre zéro d'un développement de Taylor. En utilisant les méthodes de simulation pour construire la base de données de la régression, un nouvel estimateur de la sensibilité locale est ainsi obtenu. Cet estimateur est biaisé mais son biais est contrôlable grâce aux paramètres de régression : le degré du polynôme ainsi que l'intervalle de régression. Les deux algorithmes sont mis en pratique indépendamment avec différentes applications pour démontrer leur robustesse. Une étude de la fiabilité d'un oscillateur de Duffing permet de tester la combinaison des deux algorithmes pour un système de grande dimension possédant plusieurs régions de défaillance.