Thèse en cours

Machine Learning et Phytoplancton nuisible : définition des états environnementaux favorables aux efflorescences, et développement d’un système expert de prévision, d’alerte et d’aide à la décision.

FR  |  
EN

Accès à la thèse

Triangle exclamation pleinLa soutenance a eu lieu le 18/09/2024. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Raed Halawi ghosn
Direction : Alain LefebvreEmilie Poisson caillault
Type : Projet de thèse
Discipline(s) : Sciences de la Mer - Biologie et écologie
Date : Inscription en doctorat le
Soutenance le 18/09/2024
Etablissement(s) : Littoral
Ecole(s) doctorale(s) : École doctorale Sciences, technologie et santé (Amiens)
Partenaire(s) de recherche : Laboratoire : LERB - Laboratoire Environnement Ressources de Boulogne-sur-Mer
Jury : Président / Présidente : Eric Thiebaut
Examinateurs / Examinatrices : Alain Lefebvre, Pascal Claquin, Anouk Blauw, Emilie Poisson-caillault, Laurent Coppola
Rapporteurs / Rapporteuses : Pascal Claquin, Laurent Coppola

Résumé

FR  |  
EN

Le phytoplancton est constitué de l’ensemble des organismes photosynthétiques présents à la base de la chaîne alimentaire. Il soutient les niveaux trophiques supérieurs et joue un rôle crucial dans les cycles biogéochimiques. Sa biomasse peut augmenter lorsque des conditions favorables, telles que la lumière et les nutriments, sont disponibles, conduisant à des efflorescences algales toxiques et/ou nuisibles (HABs) et pouvant être liées à l'eutrophisation. Les HABs peuvent être à l’origine de la présence de toxines dans l'eau, provoquant la mort de certains organismes marins et impactant la biodiversité marine. Ils peuvent également impacter l'économie et les activités récréatives, et avoir des effets néfastes sur la santé humaine lorsque des coquillages contaminés sont consommés. L'objectif de cette thèse est de développer un système numérique expert capable de prédire les HABs et d'alerter les professionnels de la mer, les gestionnaires de l’environnement et les décideurs dans trois régions principales : (1) la Manche orientale, (2) la Manche centrale et (3) la mer d'Iroise. Pour atteindre cet objectif, une approche intégrée multi-source, multi-paramètre, multi-critère, multi-échelle et multi-fréquence est adoptée, combinant des données in situ, satellitaires et de modélisation. Plusieurs étapes de traitement ont été effectuées sur les données avec notamment la correction des décalages temporels et la complétion des valeurs manquantes, l'optimisation de la phase de contrôle qualité des données. Une fois validés et qualifiés, les jeux de données utilisés dans ces travaux ont été classifiés en utilisant l'algorithme de clustering spectral multi-niveaux (M-SC). Par ailleurs, au regard des connaissances acquises et inspiré par le concept du Mandala de Margalef, un nouveau diagramme de Margalef étendu a été développé. Les groupes (clusters) obtenus, donc les états environnementaux caractéristiques de la dynamique des efflorescences algales, ont ensuite été étiquetés en lien avec les experts des régions étudiées. Ensuite, l'algorithme de «Random Forest» (RF) a été utilisé pour développer un modèle capable de prédire les groupes donc les états environnementaux à partir de nouveaux jeux de données. Il est important de souligner que la nouveauté de ce système de prévision et d’alerte réside dans le concept semi-supervisé combinant l'algorithme non supervisé (M-SC) avec un modèle de type «Random Forest». Nos résultats indiquent que le M-SC est capable de révéler plusieurs états environnementaux tels que les événements récurrents, rares et extrêmes, y compris les efflorescences algales nuisibles. Nous montrons également que la forêt aléatoire a permis d’obtenir des résultats pertinents pour la prédiction des états environnementaux à 2, 4, 7 et 10 jours.