Hybridation de la programmation génétique avec du machine learning spécialisé
Auteur / Autrice : | Camilo De la torre |
Direction : | Sylvain Cussat-blanc |
Type : | Projet de thèse |
Discipline(s) : | Informatique et Télécommunications |
Date : | Inscription en doctorat le 01/10/2023 |
Etablissement(s) : | Université Toulouse Capitole |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications |
Partenaire(s) de recherche : | Laboratoire : IRIT : Institut de Recherche en Informatique de Toulouse |
Equipe de recherche : REVA - Réel Expression Vie Artificielle |
Mots clés
Mots clés libres
Résumé
L'objectif est d'hybrider le Genetic Programming avec des algorithmes de machine learning type Support Vector Machine, Decision Tree, Random Forest, réseaux de neurones (MLP et Deep learning) pour potentialiser les capacités de la programmation génétique dans certaines tâches. Nous développerons cette approche théorique dans l'analyse d'images biomédicales. Par exemple, dans une tâche d'analyse d'images, il existe un certain nombre de réseaux de neurones convolutifs pré-entraînés pour détecter, segmenter ou classifier des structures dans les images. L'aspect limitant de ces approches est leur manque de transparence dans leur raisonnement. Notre hypothèse est qu'en hybridant les deux approches, les résultats seront améliorés en termes de performance et seront équivalents à ceux obtenus par les approches blackbox en profitant des capacités d'apprentissage des algorithmes de machine learning. Nous escomptons de plus une amélioration de l'explicabilité des modèles obtenus car ces modèles seront constitués d'un ensemble de blocs de machine learning spécialisés dans une tâche précisément décrite. Ainsi, même si chaque modèle Machine Learning n'est pas explicable, l'ensemble du pipeline le sera du fait que les modèles de Machine Learning seront entraînés à détecter des structures bien précises. Nous utiliserons du Cartesian Genetic Programming pour les assembler est produire des pipelines de segmentation et ou de classification d'images par rapport à des pathologies identifiées. Nous estimons aussi que l'utilisation de modèles ML spécialisés permettra d'améliorer la performance générale des pipelines en agençant des modèles plus efficaces sur des tâches simples plutôt que de produire de gros modèles entrainés à résoudre des tâches complexes.