Classification du cancer du sein par des approches basées sur les systèmes immunitaires artificiels
Auteur / Autrice : | Rima Dabladji |
Direction : | Khalifa Djemal |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 28/09/2016 |
Etablissement(s) : | Université Paris-Saclay (ComUE) |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | établissement opérateur d'inscription : Université d'Évry-Val-d'Essonne (1991-....) |
Laboratoire : Informatique, Biologie Intégrative et Systèmes Complexes (Evry, Essonne) | |
Jury : | Président / Présidente : William Puech |
Examinateurs / Examinatrices : Hichem Maaref | |
Rapporteurs / Rapporteuses : Frédéric Bouchara, Lionel Fillatre |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Le cancer du sein arrive dans le monde en première position en termes d’incidence et de mortalité parmi les différentes localisations cancéreuses chez les femmes. Malgré les avancées significatives faites ces dernières décennies en vue d’améliorer la gestion de ce type de cancer, des outils de diagnostic plus précis sont encore nécessaires pour aider les experts à lutter contre cette maladie mortelle. Dans ce cadre, des travaux de recherche considérables ont été réalisés dans l’espoir d’apporter de nouvelles perspectives pour l’amélioration du diagnostic du cancer du sein, en développant des systèmes de Décision Assistés par Ordinateur (DAO). Beaucoup de travaux se sont dirigés vers la détection de la présence de tissus cancéreux dans le sein et la classification de tumeurs en utilisant des outils issus de l’intelligence artificielle souvent inspirés par les systèmes naturels. En l’occurrence, les Systèmes Immunitaires Artificiels (SIA) constituent un domaine de recherche qui comble les domaines de l’immunologie, l’informatique et l’ingénierie. Les principaux développements au sein des systèmes immunitaires artificiels, ont mis l’accent sur trois principales théories immunologiques : la sélection clonale, les réseaux immunitaires et la sélection négative. Nous nous intéressons dans ce travail à l’utilisation de algorithmes de sélection clonale pour la classification des cellules mammaires en Bénignes/Malignes. En effet, ces approches sont généralement basées sur deux principaux processus : la reconnaissance de la forme de l’antigène et la sélection de la cellule mémoire spécifique à ce dernier. L’idée établie est que seules les cellules mémoires capables de reconnaître l’antigène sont sélectionnées pour le clonage et la mutation. Après avoir présenté le principe de ces algorithmes, nous étudierons, à travers plusieurs approches, leurs performances. Tout d’abord, on s’intéresse à l’amélioration de l’algorithme CLONALG, qui est un des algorithmes de base dans le domaine de la sélection clonale artificielle. Afin de renforcer l’apprentissage de ce dernier, avec une meilleure initialisation et une diversité maîtrisée, trois différentes méthodes sont proposées appelées Median Filter Clonal ALGorithm (MF-CLONALG), Average Cells Clonal ALGorithm (AC-CLONALG) et Validity Interval Clonal Selection (VI-CS). Cependant, bien qu’elles soient performantes, ces approches nécessitent un temps important de calcul. Dans ce contexte, la seconde approche qu’on propose vise à réduire les taux de calcul de ces algorithmes (et ceux des SIA en général) sans affecter leurs performances. L’algorithme Local Database Categorization Artificial Immune System (LDC-AIS) utilise le regroupement par K-means pour la catégorisation locale des données, et le réseau de neurones RBF pour l’apprentissage des catégories, afin d’accélérer le processus de sélection. La dernière partie de la thèse est dédiée à l’optimisation multimodale. En effet, après avoir présenté les algorithmes de sélection clonale comme outil compétitif de reconnaissance des formes et de classification, nous nous sommes intéressés à explorer ce concept, afin de démontrer les avantages des opérateurs de clonage et de mutations dans le cadre de l’optimisation de fonctions. En réponse à certains inconvénients du réseau de neurones MLP (Multi-Layer Perceptron), une procédure d’optimisation en plusieurs étapes est proposée, dans laquelle la rétropropagation est assistée par les processus de clonage et de mutation, pour une convergence plus rapide et précise du MLP. L’approche Multi-Layer Perceptron based Clonal Selection (MLP-CS) étant voisine des techniques évolutionnaires est comparée à un MLP optimisé par un algorithme génétique. Chacune des approches proposées dans ce travail est testée et comparée à différents travaux antérieurs en utilisant deux différentes bases de données mammaires à savoir la Wisconsin Diagnostic Breast Cancer (WDBC) et la Digital Database for Screening Mammography (DDSM).