Thèse soutenue

Traitement d'échantillons confus dans un modèle basé sur la classification d'images

FR  |  
EN
Auteur / Autrice : Jiarui Xie
Direction : Thierry ChateauViolaine Antoine
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 11/07/2022
Etablissement(s) : Université Clermont Auvergne (2021-...)
Ecole(s) doctorale(s) : École doctorale des sciences pour l'ingénieur (Clermont-Ferrand)
Partenaire(s) de recherche : Equipe de recherche : Laboratoire d'Informatique, de Modélisation et d'Optimisation des Systèmes
Jury : Président / Présidente : Engelbert Mephu-Nguifo
Examinateurs / Examinatrices : Nicolas Sutton-Charani
Rapporteurs / Rapporteuses : David Mercier, Didier Coquin

Résumé

FR  |  
EN

Pour les modèles basés sur la classification d'images, il est important de garantir que le modèle entraîné par des échantillons du domaine fasse des prédictions correctes et fiables lorsqu'il rencontre des échantillons confus. Par conséquent, trois nouvelles méthodes entourant l'estimation de l'incertitude et la classification partielle, respectivement, sont proposées. La portée de la thèse est limitée au modèle basé sur la classification d'images, et l'échantillon confus contient des échantillons hors-domaine et imprécis.La stratégie d'estimation de l'incertitude peut calculer une valeur représentant l'incertitude prédictive, puis détecter les échantillons confus en les comparant à un seuil prédéfini.Dans la première partie de cette thèse, une méthode d'estimation d'incertitude basée sur la logique subjective (SLUE) est proposée en étendant la méthode existante nommée Evidential Deep Learning (EDL). Par rapport à l'EDL qui négligeait les avantages du taux de base, la méthode SLUE prend explicitement en compte les taux de base. Le taux de base dans SLUE est utilisé pour guider le processus de formation dans la direction souhaitée.Grâce à l'estimation de l'incertitude, nous pouvons décider de rejeter ou d'accepter une prédiction. Cependant, il est plus raisonnable de prédire un sous-ensemble pour une prise de décision prudente. Par conséquent, une classification partielle dérivée de la sortie du modèle (PCMO) est proposée dans la deuxième partie. La méthode PCMO peut attribuer des croyances à des sous-ensembles imbriqués selon la théorie de Dempster-Shafer (DST). Cela peut atténuer l'augmentation exponentielle du nombre de sous-ensembles due à l'augmentation du nombre de classes. Comparée aux méthodes existantes, la méthode PCMO présente un cadre simple et évolutif. D'une part, la méthode PCMO est remplie uniquement sur la sortie du modèle qui peut être appliquée à n'importe quel réseau neuronal convolutif pré-entraîné, sans qu'il soit nécessaire de réentraîner le modèle ou d'effectuer d'autres modifications. D'autre part, en considérant les bonnes caractéristiques de la fonction log et en analysant le modèle régulier de la sortie du modèle, une transformation nouvelle et raisonnable de la sortie du modèle en distribution de possibilités est proposée.Une faiblesse de la méthode PCMO est qu'elle ne peut pas fournir de croyances pour l'ensemble vide et l'ensemble entier. Par conséquent, nous avons repensé le processus de calcul des possibilités et proposé une nouvelle méthode appelée PCBS qui combine la DST et la fonction en forme de cloche. Dans ce cas, la fonction en forme de cloche est responsable du calcul des possibilités en prenant les informations fournies par la sortie de formation. Ce faisant, le modèle est capable d'attribuer des croyances à l'ensemble vide et à l'ensemble entier, ce qui permet de distinguer les échantillons hors-domaine des échantillons imprécis.