Thèse soutenue

Apprentissage multi-instance des données de séquences : Application à la prédiction de la radio- résistance chez les bactéries

FR  |  
EN
Auteur / Autrice : Manel Zoghlami
Direction : Engelbert Mephu-NguifoAmel Borgi
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 20/12/2019
Etablissement(s) : Université Clermont Auvergne‎ (2017-2020) en cotutelle avec Université de Tunis El Manar
Ecole(s) doctorale(s) : École doctorale des sciences pour l'ingénieur (Clermont-Ferrand)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique, de Modélisation et d'Optimisation des Systèmes
Jury : Examinateurs / Examinatrices : Jean Sallantin, Khedija Arour
Rapporteurs / Rapporteuses : Marie-Dominique Devignes, Faten Chaieb-Chakchouk

Résumé

FR  |  
EN

Dans l’apprentissage multi-instances (MI) pour les séquences, les données d’apprentissage consistent en un ensemble de sacs où chaque sac contient un ensemble d’instances/séquences. Dans certaines applications du monde réel, comme la bioinformatique, comparer un couple aléatoire de séquences n’a aucun sens. En fait, chaque instance de chaque sac peut avoir une relation structurelle et/ou fonctionnelle avec d’autres instances dans d’autres sacs. Ainsi, la tâche de classification doit prendre en compte la relation entre les instances sémantiquement liées à travers les sacs. Dans cette thèse, nous présentons deux approches de classification MI des séquences nommées ABClass et ABSim. ABClass extrait les motifs à partir des instances reliées et les utilise pour encoder les séquences. Un classifieur discriminant est ensuite appliqué pour calculer un résultat de classification partiel pour chaque ensemble de séquences liées. ABSim utilise une mesure de similarité pour discriminer les instances reliées et calcule une matrice de scores. Pour les deux approches, une méthode d’agrégation est appliquée afin de générer le résultat final de la classification. Nous appliquons les deux approches au problème de prédiction de la résistance aux rayonnements ionisants chez les bactéries.Les résultats expérimentaux sont satisfaisants.