Thèse en cours

Hybridation de la programmation génétique avec du machine learning spécialisé

FR  |  
EN
Auteur / Autrice : Camilo De la torre
Direction : Sylvain Cussat-blanc
Type : Projet de thèse
Discipline(s) : Informatique et Télécommunications
Date : Inscription en doctorat le 01/10/2023
Etablissement(s) : Université Toulouse Capitole
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications
Partenaire(s) de recherche : Laboratoire : IRIT : Institut de Recherche en Informatique de Toulouse
Equipe de recherche : REVA - Réel Expression Vie Artificielle

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L'objectif est d'hybrider le Genetic Programming avec des algorithmes de machine learning type Support Vector Machine, Decision Tree, Random Forest, réseaux de neurones (MLP et Deep learning) pour potentialiser les capacités de la programmation génétique dans certaines tâches. Nous développerons cette approche théorique dans l'analyse d'images biomédicales. Par exemple, dans une tâche d'analyse d'images, il existe un certain nombre de réseaux de neurones convolutifs pré-entraînés pour détecter, segmenter ou classifier des structures dans les images. L'aspect limitant de ces approches est leur manque de transparence dans leur raisonnement. Notre hypothèse est qu'en hybridant les deux approches, les résultats seront améliorés en termes de performance et seront équivalents à ceux obtenus par les approches blackbox en profitant des capacités d'apprentissage des algorithmes de machine learning. Nous escomptons de plus une amélioration de l'explicabilité des modèles obtenus car ces modèles seront constitués d'un ensemble de blocs de machine learning spécialisés dans une tâche précisément décrite. Ainsi, même si chaque modèle Machine Learning n'est pas explicable, l'ensemble du pipeline le sera du fait que les modèles de Machine Learning seront entraînés à détecter des structures bien précises. Nous utiliserons du Cartesian Genetic Programming pour les assembler est produire des pipelines de segmentation et ou de classification d'images par rapport à des pathologies identifiées. Nous estimons aussi que l'utilisation de modèles ML spécialisés permettra d'améliorer la performance générale des pipelines en agençant des modèles plus efficaces sur des tâches simples plutôt que de produire de gros modèles entrainés à résoudre des tâches complexes.