Thèse soutenue

Adaptation d'approches connexionnistes non supervisées pour l'analyse de contenus d'images et de sons

FR  |  
EN
Auteur / Autrice : Benjamin Chamand
Direction : Philippe Joly
Type : Thèse de doctorat
Discipline(s) : Informatique et Télécommunications
Date : Soutenance le 16/05/2023
Etablissement(s) : Toulouse 3
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....)
Jury : Examinateurs / Examinatrices : Philippe Joly, Jean Martinet, Emmanuel Dellandréa, Valérie Gouet-Brunet, Frédéric Lerasle
Rapporteur / Rapporteuse : Jean Martinet, Emmanuel Dellandréa

Résumé

FR  |  
EN

Le cerveau humain est capable de traiter temporellement une vaste quantité d'informations sensorielles très efficacement et de les combiner de manières à en tirer des conclusions logiques. Il peut également apprendre et s'adapter en fonction de son expérience. Cette richesse fait que, depuis l'Antiquité, l'Homme est fasciné par les secrets de la cognition humaine et cherche à les comprendre. Ce domaine, plus connu de nos jours sous le terme de neurosciences cognitives, est un terrain de jeu ouvert grâce aux avancées des différentes modélisations mathématiques des mécanismes connexionnistes. À travers ces travaux de thèse, nous cherchons à étudier le comportement de ces approches connexionnistes, formé de manière non supervisée, sur la génération de représentations de données images et audios. Plus particulièrement, nous nous intéressons aux réseaux de neurones impulsionnels qui présentent certains avantages théoriques comme le traitement fin de données temporelles et une consommation énergétique maitrisée, à l'opposé des réseaux de neurones artificiels très utilisé de nos jours. Nous nous intéressons également à l'adaptation des modèles à différentes échelles : de leur topologie générale à la compréhension d'éléments permettant d'obtenir de meilleures performances sur la classification des représentations. La première partie présente le fonctionnement du neurone biologique jusqu'à sa modélisation computationnelle afin de s'en inspirer pour générer des représentations de nos données. Cependant, la rareté de ces approches dans le domaine de l'informatique appliquée nous oblige à développer notre propre simulateur pour valider différents modèles développés dans la recherche neurocomputationelle, montrant ainsi la dure réalité d'apprentissage de ces derniers. Enfin, cette difficulté nous a conduits à adapter nos modèles pour accepter des récentes stratégies d'apprentissage présent dans le domaine de l'apprentissage profond, en particulier l'apprentissage auto-supervisé. En raison de la diversité et de la sensibilité des hyperparamètres présents dans les modèles connexionnistes, la seconde partie de notre étude se focalise à comprendre comment adapter des composants d'un système pour améliorer ses performances. En d'autres termes, nous cherchons des intuitions permettant de faciliter notre décision sur le choix des valeurs à fixer pour des hyperparamètres quels qu'ils soient ou la définition de nouvelles fonctions de coût. Pour faciliter l'étude, nous nous plaçons dans le cadre d'un modèle linéaire de classification des représentations extraites, pour ensuite étudier d'une part un hyperparamètre important jouant sur la performance finale du modèle : la température, puis sur une tâche plus large telle que la compréhension de la performance d'un modèle. Pour cela, une chaîne de traitement généralisable est proposée afin d'extraire une heuristique sur la température. Puis, en y ajoutant un module de régression symbolique, nous avons pu montrer que nos résultats sont explicables et en adéquation avec des décennies de recherche.