Thèse soutenue

contribution à la définition d'une méthodologie couplant le traitement automatique du langage naturel et l'apprentissage automatique pour réagir aux perturbations de production

FR  |  
EN
Auteur / Autrice : Juan Pablo Usuga cadavid
Direction : Samir LamouriBernard Grabot
Type : Thèse de doctorat
Discipline(s) : Informatique-traitement du signal (AM)
Date : Soutenance le 13/10/2021
Etablissement(s) : Paris, HESAM
Ecole(s) doctorale(s) : École doctorale Sciences des métiers de l'ingénieur
Partenaire(s) de recherche : Laboratoire : Laboratoire d'automatique, de mécanique et d'informatique industrielles et humaines (Valenciennes, Nord ; 1994-...) - Laboratoire d'Automatique- de Mécanique et d'Informatique industrielles et Humaines - UMR 8201 / LAMIH
établissement de préparation de la thèse : École nationale supérieure d'arts et métiers (1780-....)
Jury : Président / Présidente : Mitra Fouladirad
Examinateurs / Examinatrices : Samir Lamouri, Bernard Grabot, Gülgün Alpan, Kary Främling, Dimitrios Kyritsis, Nazih Mechbal
Rapporteurs / Rapporteuses : Gülgün Alpan, Kary Främling

Résumé

FR  |  
EN

Dans l’ère de l’industrie 4.0, exploiter les données stockées dans les systèmes d’information est un axe d’amélioration des systèmes de production. En effet, ces bases de données contiennent des informations pouvant être utilisées par des modèles d’apprentissage automatique (AA) permettant de mieux réagir aux futures perturbations de la production. Dans le cas de la maintenance, les données sont fréquemment récupérées au moyen de rapports établis par les opérateurs. Ces rapports sont souvent rédigés en utilisant des champs de saisie en textes libres avec comme résultats des données non structurées et complexes : elles contiennent des irrégularités comme des acronymes, des jargons, des fautes de frappe, etc. De plus, les données de maintenance présentent souvent des distributions statistiques asymétriques : quelques évènements arrivent plus souvent que d’autres. Ce phénomène est connu sous le nom de « déséquilibre de classes » et peut entraver l’entraînement des modèles d’AA, car ils ont tendance à mieux apprendre les évènements les plus fréquents, en ignorant les plus rares. Enfin, la mise en place de technologies de l’industrie 4.0 doit assurer que l’être humain reste inclus dans la boucle de prise de décision. Si cela n’est pas respecté, les entreprises peuvent être réticentes à adopter ces nouvelles technologies.Cette thèse se structure autour de l’objectif général d’exploiter des données de maintenance pour mieux réagir aux perturbations de la production. Afin de répondre à cet objectif, nous avons utilisé deux stratégies. D’une part, nous avons mené une revue systématique de la littérature pour identifier des tendances et des perspectives de recherche concernant l’AA appliqué à la planification et au contrôle de la production. Cette étude de la littérature nous a permis de comprendre que la maintenance prédictive peut bénéficier de données non structurées provenant des opérateurs. Leur utilisation peut contribuer à l’inclusion de l’humain dans l’application de nouvelles technologies. D’autre part, nous avons abordé certaines perspectives identifiées au moyen d’études de cas utilisant des données issues de systèmes de productions réels. Ces études de cas ont exploité des données textuelles fournies par les opérateurs qui présentaient des déséquilibres de classes. Nous avons exploré l’utilisation de techniques pour mitiger l’effet des données déséquilibrées et nous avons proposé d’utiliser une architecture récente appelée « transformer » pour le traitement automatique du langage naturel.