Thèse soutenue

Nouvelle démarche de développement de modèles prédictifs de pilotage par les données en Smart-Manufacturing dans les cas de pénurie de données par l'utilisation de techniques de machine-Learning et l'IA

FR  |  
EN
Auteur / Autrice : Gengxiang Chen
Direction : Olivier BruneauYingguang LiCharyar Mehdi-Souzani
Type : Thèse de doctorat
Discipline(s) : Génie mécanique
Date : Soutenance le 25/09/2023
Etablissement(s) : université Paris-Saclay en cotutelle avec Nanjing University of Aeronautics and Astronautics (Chine)
Ecole(s) doctorale(s) : École doctorale Sciences mécaniques et énergétiques, matériaux et géosciences (Gif-sur-Yvette, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire universitaire de recherche en production automatisée (Gif-sur-Yvette, Essonne ; 1981-....)
référent : Ecole Normale Supérieure Paris-Saclay
graduate school : Université Paris-Saclay. Graduate School Sciences de l'ingénierie et des systèmes (2020-....)
Jury : Président / Présidente : James Gao
Examinateurs / Examinatrices : Jean-Yves Dantan, Kai Tang, Nabil Anwer, Changqing Liu
Rapporteurs / Rapporteuses : Jean-Yves Dantan, Kai Tang

Résumé

FR  |  
EN

Le smart-manufacturing (SM) basé sur le pilotage par les données a démontré un potentiel très significatif dans l'ensemble du processus de fabrication et a initié et enrichi de nouveaux paradigmes, tels que le jumeau numérique, l'industrie 4.0, le cloud-manufacturing. En tant qu'élément fondamental du SM, la modélisation prédictive en fabrication (MPM) vise à construire des représentations prédictives de haute-fidélité des propriétés des produits, des processus ou des systèmes de fabrication, en vue d'une optimisation ultérieure des processus pour la prise de décision.Diverses méthodes de machine-learning, ont été proposées et appliquées avec succès dans la littérature pour résoudre différents problèmes de modélisation prédictive. Cependant le niveau de performance de ces méthodes de modélisation prédictives sont directement liées à la disponibilité des données et leur structuration préalable. Malheureusement, la qualification de ces données issues de la fabrication restent un travail fastidieux et coûteux. Établir des modèles prédictifs de pilotage à partir de données en pénurie reste donc un challenge inévitable.En générale, le niveau de performance des modèles prédictifs, dépend de la quantité et de la structuration des données utilisées. On aboutit alors au verrou scientifique suivant : « comment peut-t-on combler l'insuffisance d'informations pertinentes? » Pour y répondre il convient d'agir sur deux niveaux : exploiter activement le processus de génération de données, et compensant l'insuffisance des informations de modélisation par l'intégration d'autres sources d'informations.Pour résoudre le problème de pénurie de données, cette thèse propose une nouvelle méthodologie basée sur l'échantillonnage actif de données directement labellisées et le transfert de connaissances à partir de données auxiliaires et réel combinées. (a)Dans un premier temps, une méthode d'échantillonnage basée sur la valeur d'agrégation (AV4Sam) est proposée sur la base de la théorie des jeux afin d'échantillonner les données labellisées les plus prometteuses. L'application de cette méthode sur des exemples industriels a démontré qu'elle pouvait générer activement des données optimaux par rapport aux méthodes de la littérature. Ainsi elle peut être exploité de manière proactive pour faciliter le processus ultérieur de modélisation des données. (b)Une nouvelle approche de transfert de données, l'adaptation structurée de la distribution conditionnelle (CDA), a été proposée pour faciliter le transfert de connaissances depuis des données auxiliaires vers la tache cible afin d'améliorer les performances du modèle cible dans les situations de carence de données. (c)Afin d'exploiter au maximum les connaissances réelles préexistantes (RP) du processus de fabrication, un opérateur neuronal à faible dimension guidé par le réel (LNO) a été mis au point. Il incorpore les connaissances RP dans la structure du réseau neuronal afin d'améliorer les capacités d'apprentissage dans la prédiction des propriétés des éléments et des process visés.La méthode proposée a été validée à travers plusieurs cas d'applications industriels (mesure multi-capteurs, prédiction d'usure d'outils). Ou encor le développement d'un modèle prédictif piloté par les données permettant la prédiction de déformation précise d'une pièce composite complexe tout en réduisant de manière significative les données d'apprentissage requises de 90%.En résumé, nous nous sommes intéressés à proposer un processus de génération de données pour améliorer la modélisation prédictive en particulier pour les cas où il y a une pénurie de données. Les solutions proposées sont basées sur les techniques de machine-learning et d'intelligence artificielle et contribuent non seulement à l'apprentissage automatique axé sur l'ingénierie, mais offrent également des perspectives précieuses pour le développement du Smart-Manufacturing en facilitant par exemple la mise en place des Jumeaux Numériques.