Machine Learning et Phytoplancton nuisible : définition des états environnementaux favorables aux efflorescences, et développement dun système expert de prévision, dalerte et daide à la décision.
Auteur / Autrice : | Raed Halawi ghosn |
Direction : | Alain Lefebvre, Emilie Poisson caillault |
Type : | Projet de thèse |
Discipline(s) : | Sciences de la Mer - Biologie et écologie |
Date : | Inscription en doctorat le Soutenance le 18/09/2024 |
Etablissement(s) : | Littoral |
Ecole(s) doctorale(s) : | École doctorale Sciences, technologie et santé (Amiens) |
Partenaire(s) de recherche : | Laboratoire : LERB - Laboratoire Environnement Ressources de Boulogne-sur-Mer |
Jury : | Président / Présidente : Eric Thiebaut |
Examinateurs / Examinatrices : Alain Lefebvre, Pascal Claquin, Anouk Blauw, Emilie Poisson-caillault, Laurent Coppola | |
Rapporteurs / Rapporteuses : Pascal Claquin, Laurent Coppola |
Mots clés
Résumé
Le phytoplancton est constitué de lensemble des organismes photosynthétiques présents à la base de la chaîne alimentaire. Il soutient les niveaux trophiques supérieurs et joue un rôle crucial dans les cycles biogéochimiques. Sa biomasse peut augmenter lorsque des conditions favorables, telles que la lumière et les nutriments, sont disponibles, conduisant à des efflorescences algales toxiques et/ou nuisibles (HABs) et pouvant être liées à l'eutrophisation. Les HABs peuvent être à lorigine de la présence de toxines dans l'eau, provoquant la mort de certains organismes marins et impactant la biodiversité marine. Ils peuvent également impacter l'économie et les activités récréatives, et avoir des effets néfastes sur la santé humaine lorsque des coquillages contaminés sont consommés. L'objectif de cette thèse est de développer un système numérique expert capable de prédire les HABs et d'alerter les professionnels de la mer, les gestionnaires de lenvironnement et les décideurs dans trois régions principales : (1) la Manche orientale, (2) la Manche centrale et (3) la mer d'Iroise. Pour atteindre cet objectif, une approche intégrée multi-source, multi-paramètre, multi-critère, multi-échelle et multi-fréquence est adoptée, combinant des données in situ, satellitaires et de modélisation. Plusieurs étapes de traitement ont été effectuées sur les données avec notamment la correction des décalages temporels et la complétion des valeurs manquantes, l'optimisation de la phase de contrôle qualité des données. Une fois validés et qualifiés, les jeux de données utilisés dans ces travaux ont été classifiés en utilisant l'algorithme de clustering spectral multi-niveaux (M-SC). Par ailleurs, au regard des connaissances acquises et inspiré par le concept du Mandala de Margalef, un nouveau diagramme de Margalef étendu a été développé. Les groupes (clusters) obtenus, donc les états environnementaux caractéristiques de la dynamique des efflorescences algales, ont ensuite été étiquetés en lien avec les experts des régions étudiées. Ensuite, l'algorithme de «Random Forest» (RF) a été utilisé pour développer un modèle capable de prédire les groupes donc les états environnementaux à partir de nouveaux jeux de données. Il est important de souligner que la nouveauté de ce système de prévision et dalerte réside dans le concept semi-supervisé combinant l'algorithme non supervisé (M-SC) avec un modèle de type «Random Forest». Nos résultats indiquent que le M-SC est capable de révéler plusieurs états environnementaux tels que les événements récurrents, rares et extrêmes, y compris les efflorescences algales nuisibles. Nous montrons également que la forêt aléatoire a permis dobtenir des résultats pertinents pour la prédiction des états environnementaux à 2, 4, 7 et 10 jours.