Thèse soutenue

Un point de vue statistique sur les critères de fatigue : de la classification supervisée à l'apprentissage positif-non labellisé

FR  |  
EN
Auteur / Autrice : Olivier Coudray
Direction : Christine KeribinPatrick PamphilePhilippe BristielMiguel Dinis
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 08/12/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard
Partenaire(s) de recherche : Laboratoire : Laboratoire de mathématiques d'Orsay (1998-....) - Stellantis CEMR. Centre d’Expertise Métier et Région (Poissy, Yvelines)
référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Mathématiques (2020-....)
Equipe de recherche : Inria Celeste - Statistique mathématique et apprentissage
Jury : Président / Présidente : Pascal Massart
Examinateurs / Examinatrices : Adrien Saumard, Didier Chauveau, Anne Gégout-Petit
Rapporteurs / Rapporteuses : Adrien Saumard, Didier Chauveau

Résumé

FR  |  
EN

La fiabilité des véhicules est un enjeu majeur pour les constructeurs automobiles. En particulier, la fatigue mécanique est une préoccupation importante du bureau d'études. En effet, la fatigue est un phénomène complexe qui dépend du design de la pièce (géométrie, matériaux utilisés), des procédés de fabrication, et des chargements externes subis par la pièce. Le dimensionnement à la fatigue repose sur une modélisation numérique de la pièce et sur l'application de critères de fatigue déterministes afin d'identifier de potentielles faiblesses sur la conception. Ces critères, bien qu'efficaces sur des géométries simples, ne suffisent pas à prédire correctement les risques d'amorçage sur des composants complexes. Cela entraîne un allongement des temps de développement et une augmentation des coûts liés aux prototypes physiques. Pour y remédier, les constructeurs automobiles recherchent de nouvelles méthodes digitales, pour mieux identifier les zones critiques sur de nouvelles conceptions. Dans cette thèse, nous construisons une base de données fatigue, à partir d'informations mises à disposition par Stellantis, regroupant des résultats numériques et des comptes rendus d'essais de fatigue. Une analyse non supervisée du jeu de données est réalisée, permettant de mieux comprendre sa structure ainsi que les liens entre les covariables disponibles. Ensuite, l'application de méthodes d'apprentissage supervisé (régression logistique, forêts aléatoires, SVM à noyau...) permet d'estimer des critères de fatigue offrant de meilleures prédictions que le critère mécanique déterministe usuel. Une difficulté de l'analyse provient du fait que l'étiquetage des zones est affecté par un bruit asymétrique, ce qui motive une approche originale fondée sur l'apprentissage positif-non labellisé (PU learning). Cette approche est abordée suivant tous les angles: théorique, méthodologique et appliqué. De nouvelles bornes de risques adaptées à ce cadre spécifique sont démontrées. Une méthodologie est proposée pour l'estimation d'un classifieur PU à partir des données. Enfin, la méthodologie est évaluée sur des jeux de données simulés ainsi que sur les données de fatigue. Les performances obtenues confirment l'intérêt de la méthode et son utilité pour le constructeur automobile.