Apprentissage automatique pour la segmentation et la classification des défauts du bois
Auteur / Autrice : | Marwa Kechaou |
Direction : | Gilles Gasso |
Type : | Thèse de doctorat |
Discipline(s)Â :Â | Informatique |
Date : | Soutenance le 24/11/2022 |
Etablissement(s)Â :Â | Normandie |
Ecole(s) doctorale(s) : | École doctorale mathématiques, information et ingénierie des systèmes (Caen) |
Partenaire(s) de recherche : | Établissement de préparation : Institut national des sciences appliquées Rouen Normandie (Saint-Etienne-du-Rouvray ; 1985-....) |
Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...) | |
Jury : | Président / Présidente : Michèle Sebag |
Examinateurs / Examinatrices : Gilles Gasso, Fabrice Mériaudeau, Céline Hudelot, Romain Hérault, Julien Rabin, Elmokhtar Ezzahdi Alaya | |
Rapporteurs / Rapporteuses : Fabrice Mériaudeau, Céline Hudelot |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse est une cifre réalisée en collaboration avec Luxscan Technologies, une entreprise leader dans la conception, le développement et l'installation de scanners industriels pour l'automatisation de l'industrie du bois. Les algorithmes dédiés à la détection et à la classification des défauts du bois pour aider à contrôler la qualité du bois impliquent un grand nombre de paramètres. Ils doivent être configurés par un technicien expert afin de garantir de bonnes performances, entraînant ainsi un long processus d'installation. Afin d'automatiser la configuration des scanners pour diverses conditions, nous avons recours aux techniques d'apprentissage profond appliquées à la vision par ordinateur, car elles ont prouvé leurs capacités dans de nombreux domaines d'application. Pour élaborer les architectures d'apprentissage profond, des bases de données de bois annotées par les experts de l'entreprise ont été fournies et contiennent des échantillons multimodaux composés de signaux laser en plus des images RVB. Elles mettent en évidence un déséquilibre extrême entre les défauts, dont certains sont très difficiles à décrire en raison de leur forme ou de leur interférence avec d'autres défauts. Dans cette thèse, nous nous concentrons d'abord sur la classification d'images appliquée aux défauts du bois. Nous étudions des architectures de l'état de l'art et différentes fonctions de perte. Nous apprenons un modèle qui traite des classes fortement déséquilibrées tout en garantissant un faible temps d'inférence pour permettre une classification en temps réel. Le bois provient de plusieurs espèces présentant des caractéristiques différentes, à savoir la liste des défauts et leurs proportions. Cela entraîne un décalage dans les distributions des échantillons de bois qui entrave la généralisation du modèle. Pour pallier cet inconvénient, nous explorons l'adaptation de domaine basée sur le transport optimal pour aligner les distributions déviées. Nous développons une approche qui tient compte des différentes distributions d'étiquettes entre le domaine source et le domaine cible lorsque ce dernier comporte des défauts inconnus. Ensuite, nous explorons la tâche de segmentation sémantique pour effectuer une classification et une détection de bout en bout des défauts du bois. Les annotations disponibles au pixel près attribuent aux défauts hybrides les multiples classes qu'ils représentent. Nous concevons des fonctions de perte appropriées pour fournir des prédictions mono-classe ou multi-classe. De plus, nous concevons de nouvelles stratégies pour traiter deux types de déséquilibre : entre les classes de défauts d'une part, et entre les défauts et le bois sain d'autre part, et nous démontrons la polyvalence de nos approches. Enfin, nous étudions l'adaptation semi-supervisée au domaine, appliquée aux réseaux de segmentation sémantique, où nous supposons un accès partiel aux étiquettes du domaine cible. Nous revisitons les objectifs d'apprentissage des méthodes standard basées sur l'apprentissage antagoniste. Nous attribuons un nouveau rôle aux échantillons cibles étiquetés et concevons un nouveau problème d'optimisation. Nous proposons également une stratégie de sélection non supervisée pour rechercher les échantillons cibles les plus difficiles à adapter et fournir leur annotation afin d'améliorer les résultats de l'adaptation de domaine semi-supervisée pour la tâche de segmentation.