Thèse soutenue

Un noyau des plus proches voisins pour la classification : application aux images de plancton bidimensionnelles in situ avec correction des estimations de volume total pour les copépodes

FR  |  
EN
Auteur / Autrice : Cédric Dubois
Direction : Éric Debreuve
Type : Thèse de doctorat
Discipline(s) : Automatique, traitement du signal et des images
Date : Soutenance le 30/03/2023
Etablissement(s) : Université Côte d'Azur
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....)
Partenaire(s) de recherche : Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) - Laboratoire Informatique, signaux et systèmes (Sophia Antipolis, Alpes-Maritimes)
Jury : Président / Présidente : Frédéric Precioso
Examinateurs / Examinatrices : Éric Debreuve, Frédéric Precioso, Émilie Poisson, Ketil Malde, Bertrand Granado, Frédéric Maps
Rapporteurs / Rapporteuses : Émilie Poisson, Ketil Malde, Bertrand Granado

Résumé

FR  |  
EN

Les organismes qui composent le plancton sont des éléments essentiels de la biosphère : à la base de la chaine alimentaire marine, ils sont au cœur des cycles biogéochimiques, notamment du carbone, de l'azote et de l'oxygène. En effet, le phytoplancton capte le dioxyde de carbone de l'atmosphère et produit du dioxygène ; le zooplancton contribue à exporter ce carbone en profondeur. Les écologues étudient cette « pompe à carbone biologique », afin d'évaluer son efficacité actuelle et future face changement climatique. Une approche moderne consiste à étudier la manière dont l'environnement est lié au fonctionnement des écosystèmes par le biais des « traits » (caractéristiques individuelles) des organismes. Une corrélation importante a été observée entre la distribution des tailles des zooplanctons et l'efficacité de la séquestration du carbone. Des instruments d'imagerie in situ et de grands jeux de données d'images ont été mis en œuvre pour le plancton, permettant la classification taxonomique des organismes et la quantification du volume total par groupe. Le développement de méthodes de classification automatisée a été essentiel pour l'assistance au traitement des données. À ce titre, les Réseaux de Neurones Artificiels (RNAs) se sont avérés très utiles et précis, mais leurs décisions sont souvent difficiles à interpréter. Dans un premier temps, nous montrons que l'approche transformation-puis-classification-simple des RNAs avec une transformation simple et explicite, conduit à une méthode de classification dont les prédictions sont interprétables (donc fiables) et précises. La transformation proposée est définie comme une combinaison linéaire de cibles par classe. Ensuite, la classification est effectuée, comme avec les RNAs, en prenant la cible la plus proche. Notre résultat principal démontre que cette transformation définit un noyau associé au classifieur des k-plus-Proches-Voisins-Pondérés (kPPP). Ceci permet d'interpréter les kPPP comme un membre d'une famille plus large de classifieurs utilisant des cibles, qui satisfait un critère d'optimalité. Nous proposons une implémentation moderne des kPPP suffisamment efficace pour traiter de grands ensembles de données, tels que ceux collectés chaque jour par les instruments d'imagerie du plancton. Nous avons ainsi effectué une validation croisée avec l'omission d'un échantillon sur de grands jeux de données d'images de plancton. Dans un second temps, nous étudions l'estimation du volume des copépodes à partir d'images bidimensionnelles in situ. Les copépodes constituent le groupe zooplanctonique le plus abondant. Les deux méthodes standards d'estimation du volume sont biaisées en raison de l'effet de la projection sur le plan de l'image. L'une utilise le Diamètre Équivalent Sphérique (DES) et l'autre, l'ajustement d'une ellipse. Nous présentons une procédure pour corriger les estimations de volume total des deux méthodes pour ce groupe. La projection du corps du copépode seulement est extraite. Nous observons en outre que la projection exacte d'une ellipsoïde sur le plan est une ellipse. Par conséquent, à partir de la simulation de nombreuses ellipsoïdes réalistes (grâce à des mesures de taille manuelles) et de leurs projections selon une orientation aléatoire, nous calculons un facteur de correction du volume total par méthode. Contrairement à une nouvelle méthode d'estimation, les corrections proposées permettent d'améliorer les estimations des études passées, tout en étant applicables aux prochaines. À titre de validation, nous appliquons la procédure de correction aux estimations du volume total de 150 000 copépodes à partir d'images prises par un instrument in situ. Les facteurs corrections permettent de réduire l'écart entre les deux estimations d'un facteur 50, et indiquent que la méthode DES tend à surestimer le volume total d'environ 20 % et que celle utilisant l'ellipse tend à le sous-estimer d'environ 10 %.