Approches d'apprentissage automatique pour la détection et la classification des déchets dans les vidéos sous-marines en vue du nettoyage robotisé des fonds marins.
| Auteur / Autrice : | Cyril Barrelet |
| Direction : | Marc Goutterfarde, Marc Chaumont |
| Type : | Projet de thèse |
| Discipline(s) : | SYAM - Systèmes Automatiques et Micro-Électroniques |
| Date : | Inscription en doctorat le Soutenance le 23/09/2025 |
| Etablissement(s) : | Université de Montpellier (2022-....) |
| Ecole(s) doctorale(s) : | École Doctorale Information, Structures, Systèmes |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique, de Robotique et de Micro-électronique de Montpellier |
| Equipe de recherche : Département Informatique | |
| Jury : | Président / Présidente : Sylvie Chambon |
| Examinateurs / Examinatrices : Marc Goutterfarde, Marc Chaumont, Vincent Creuze, Gérard Subsol, Ouiddad Labbani-igbida, Chloé Friguet, Florence Sedes | |
| Rapporteurs / Rapporteuses : Sylvie Chambon, Florence Sedes |
Mots clés
Mots clés libres
Résumé
Chaque année, entre 4,8 et 12,7 millions de tonnes de macro-déchets terminent dans les océans. Le projet européen MAELSTROM (MArinE Litter SusTainable RemOval and Management) a vu le jour dans ce contexte. Ce projet a pour visée d'identifier, collecter, trier et recycler les macro-déchets sous-marins pour les transformer en matières premières. La thèse s'inscrit dans ce projet. Elle s'intéresse à l'identification et à la collecte de macro-déchets à l'aide d'une plateforme robotisée. L'objectif est de fournir une aide au pilotage via une caméra intelligente immergée, laquelle détecte automatiquement et classifie les objets sur le fond marin et les affiche en temps réel sur l'interface opérateur. L'humain prend alors la décision finale de récupérer ou non les cibles afin d'éviter tout risque (par exemple, une confusion entre un déchet et des pièces archéologiques fragiles, des déchets toxiques ou encore des munitions). Les déchets sous-marins sont extrêmement diversifiés en termes de matériaux (papier, tissu, métal, bois, plastique, verre, etc.) et d'apparence (colorés, réfléchissants, transparents, etc.). Afin de pouvoir traiter tous les cas, les méthodes récentes de détection se fondent sur les techniques d'apprentissage supervisé par réseau neuronal convolutif. Cependant, leurs performances restent limitées du fait du manque de bases de données d'images et de la très petite taille de celles qui sont disponibles. Cette thèse s'est donc concentrée sur la création, l'analyse et l'évaluation de telles bases. Dans un premier temps, après un état de l'art des bases existantes, nous avons proposé trois nouvelles bases de données (Uno, Morgane, Venise). Nous avons ensuite étudié leur décalage selon plusieurs scénarios réalistes et évalué l'impact de leur diversité sur la capacité de généralisation des réseaux de neurones. Enfin, nous avons proposé une extension de la validation croisée par K-fold. Celle-ci étend les méthodes de validation croisée, initialement conçues pour l'évaluation des modèles de classification, aux modèles de détection. Elle réduit la variabilité des performances sur de petites bases de données et permet une comparaison plus fiable des architectures de détection. L'analyse des différents résultats révèle des pistes de recherche prometteuses, en particulier l'exploration de la caractérisation de la dimension intrinsèque d'une base de données pour la détection, ou encore la découverte de nouvelles classes dans une base de données cible.