Thèse soutenue

Un système intelligent pour le classement du café et l'identification des maladies

FR  |  
EN
Auteur / Autrice : Serawork amsalu Wallelign
Direction : Cédric Buche
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 04/02/2020
Etablissement(s) : École nationale d'ingénieurs de Brest
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance
Jury : Président / Présidente : Patrick Meyer
Examinateurs / Examinatrices : Cédric Buche, Patrick Meyer, Jean-Michel Loubès, Dominique Vaufreydaz, Pascal Redou, Mihai Polceanu
Rapporteurs / Rapporteuses : Jean-Michel Loubès, Dominique Vaufreydaz

Résumé

FR  |  
EN

L'un des facteurs clés du succès des modèles d'apprentissage profond est leur capacité d'apprendre automatiquement des représentations importantes à partir des données d'entrée, sans qu'il soit nécessaire que des experts humains conçoivent des caractéristiques spécifiques aux tâches. Cependant, pour apprendre ces représentations, les méthodes d'apprentissage en profondeur nécessitent généralement de grandes quantités de données, qui sont coûteuses à obtenir, surtout en raison des efforts requis pour recueillir et étiqueter les données. Cette thèse examine l'applicabilité de l'apprentissage en profondeur à des situations du monde réel où les données existent en petites quantités, recueillies à différents endroits (laboratoires), en utilisant différentes techniques d'acquisition et dans des conditions minimales contrôlées. Il y a deux contributions principales. Tout d'abord, nous nous attaquons au problème de la détection des maladies du caféier, qui jusqu'à présent n'était pas abordé dans la littérature, en utilisant un ensemble de données contenant des images de maladies du caféier téléchargées sur Internet et que nous avons capturées à la ferme, et une approche transfert - apprentissage. Il a été possible de concevoir un modèle qui classifie les maladies du caféier avec une précision de 90,18 % en utilisant seulement 562 images du caféier. Deuxièmement, nous nous attaquons au problème du classement des grains de café. Un ensemble de données pour le classement des grains de café est créé en capturant des images de grains de café à la branche Jimma du Commodity Exchange (ECX) de l'Éthiopie en deux séries. Afin de tenter de résoudre le décalage de l'ensemble de données qui s'est produit dans les deux ensembles en raison des différences d'éclairage et de caméra, des algorithmes de correction des couleurs ont été ajoutés au pipeline existant de traitement des images et d'augmentation des données. Toutefois, ces techniques n'ont pas amélioré les performances du modèle par rapport aux méthodes de prétraitement couramment utilisées. Cela indique que la différence dans les techniques d'acquisition d'images n'était pas la seule raison du décalage de l'ensemble de données. Nous avons proposé et évalué une architecture de réseau qui, combinée à des techniques d'augmentation des données et d'apprentissage d'ensemble, a mené à un classificateur amélioré (précision de 89,1 % sur l'ensemble des données d'essai) qui évalue les grains de café et qui est plus performant que les méthodes classiques d'apprentissage machine (amélioration de 25,47 %) et que les modèles prêts-à-servir (18 %). L'ensemble de données sur les grains de café et les modèles seront mis à la disposition du public pour appuyer la poursuite des recherches sur ces sujets importants.