Thèse soutenue

Machine Learning et Phytoplancton nuisible : définition des états environnementaux favorables aux efflorescences, et développement d’un système expert de prévision, d’alerte et d’aide à la décision

FR  |  
EN
Auteur / Autrice : Raed Halawi Ghosn
Direction : Alain LefebvreÉmilie Poisson
Type : Thèse de doctorat
Discipline(s) : Sciences agronomiques et Ecologique. Sciences de la Mer - Biologie et écologie
Date : Soutenance le 18/09/2024
Etablissement(s) : Littoral
Ecole(s) doctorale(s) : École doctorale Sciences, technologie et santé (Amiens)
Partenaire(s) de recherche : Laboratoire : Laboratoire Environnement et Ressources (Boulogne-sur-Mer, Pas-de-Calais) - Laboratoire Environnement Ressources de Boulogne sur Mer
Financeur : Office français de la biodiversité (OFB)
Jury : Président / Présidente : Éric Thiébaut
Examinateurs / Examinatrices : Pascal Claquin, Laurent Coppola, Anouk Blauw
Rapporteur / Rapporteuse : Pascal Claquin, Laurent Coppola

Résumé

FR  |  
EN

Le phytoplancton est constitué de l'ensemble des organismes photosynthétiques présents à la base de la chaîne alimentaire. Il soutient les niveaux trophiques supérieurs et joue un rôle crucial dans les cycles biogéochimiques. Sa biomasse peut augmenter lorsque des conditions favorables, telles que la lumière et les nutriments, sont disponibles, conduisant à des efflorescences algales toxiques et/ou nuisibles (HABs) et pouvant être liées à l'eutrophisation. Les HABs peuvent être à l'origine de la présence de toxines dans l'eau, provoquant la mort de certains organismes marins et impactant la biodiversité marine. Ils peuvent également impacter l'économie et les activités récréatives, et avoir des effets néfastes sur la santé humaine lorsque des coquillages contaminés sont consommés. L'objectif de cette thèse est de développer un système numérique expert capable de prédire les HABs et d'alerter les professionnels de la mer, les gestionnaires de l'environnement et les décideurs dans trois régions principales : (1) la Manche orientale, (2) la Manche centrale et (3) la mer d'Iroise. Pour atteindre cet objectif, une approche intégrée multi-source, multi-paramètre, multi-critère, multi-échelle et multi-fréquence est adoptée, combinant des données in situ, satellitaires et de modélisation. Plusieurs étapes de traitement ont été effectuées sur les données avec notamment la correction des décalages temporels et la complétion des valeurs manquantes, l'optimisation de la phase de contrôle qualité des données. Une fois validés et qualifiés, les jeux de données utilisés dans ces travaux ont été classifiés en utilisant l'algorithme de clustering spectral mutli-niveaux (M-SC). Par ailleurs, au regard des connaissances acquises et inspiré par le concept du Mandala de Margalef, un nouveau diagramme de Margalef étendu a été développé. Les groupes (clusters) obtenus, donc les états environnementaux caractéristiques de la dynamiques des efflorescences algales, ont ensuite été étiquetés en lien avec les experts des régions étudiées. Ensuite, l'algorithme de ''Random Forest'' (RF) a été utilisé pour développer un modèle capable de prédire les groupes donc les états environnementaux à partir de nouveaux jeux de données. Il est important de souligner que la nouveauté de ce système de prévision et d'alerte réside dans le concept semi-supervisé combinant l'algorithme non supervisé (M-SC) avec ''Random Forest''. Nos résultats indiquent que le M-SC est capable de révéler plusieurs états environnementaux tels que les événements récurrents, rares et extrêmes, y compris les efflorescences algales nuisibles. Nous montrons également que la forêt aléatoire a permis d'obtenir des résultats pertinents pour la prédiction des états environnementaux à 2 jusqu'à 10 jours.