Thèse soutenue

Stratégies de contrôle renforcé par apprentissage pour les véhicules autonomes

FR  |  
EN
Auteur / Autrice : Mohammed-Yassine Kebbati
Direction : Naïma Ait OufroukhVincent VigneronDalil Ichalal
Type : Thèse de doctorat
Discipline(s) : Automatique
Date : Soutenance le 26/05/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Informatique, Biologie Intégrative et Systèmes Complexes (Evry, Essonne)
référent : Université d'Évry-Val-d'Essonne (1991-....)
graduate school : Université Paris-Saclay. Graduate School Sciences de l'ingénierie et des systèmes (2020-....)
Equipe de recherche : SIAM : Signal, Image, AutoMatique
Jury : Président / Présidente : Mara Tanelli
Examinateurs / Examinatrices : Angelo Alessandri, Igor Skrjanc, Rodolfo Orjuela, William Pasillas-Lépine
Rapporteurs / Rapporteuses : Angelo Alessandri, Igor Skrjanc, Rodolfo Orjuela

Résumé

FR  |  
EN

Dans un monde où les gens sont constamment en mouvement et ou la mobilité personnelle est préférée, le nombre de voitures personnelles sur la route ne cesse d'augmenter. Cela a induit plus de risque d'accidents de route, des conditions de circulation et de pollution de l'air plus dégradées. Par conséquent, les chercheurs travaillent depuis des décennies pour une transition vers la conduite autonome. Cette dernière a la capacité de remodeler la mobilité en diminuant les accidents de route, les embouteillages et la pollution de l'air, ce qui se traduirait par plus d'efficacité énergétique et de productivité, oû le temps de conduite pourra plutôt être utilisé pour d'autres activités. Les véhicules autonomes sont des systèmes complexes constitués de plusieurs modules qui effectuent la perception, la prise de décision, la planification et le contrôle. Le module de commande, composé d'un contrôle longitudinal et d'un contrôle latéral, est essentiel pour obtenir une conduite automatique. En raison de la nature hautement dynamique et en constante évolution des environnements routiers, le module de commande des systèmes de conduite autonome doit apprendre et s'adapter à ces environnements dynamiques en exploitant les données disponibles et en utilisant différentes techniques d'apprentissage. Cette thèse apporte quelques contributions à l'état de l'art des stratégies de contrôle amélioré et appliquées à la conduite autonome. Les contributions abordent les tâches de contrôle longitudinal et latéral séparément, puis le contrôle latéral et longitudinal coordonné et couplé. Pour le contrôle longitudinal, nous proposons l'approche PID adaptatif en utilisant deux techniques différentes : l'optimisation et l'adaptation hors ligne à l'aide d'algorithmes génétiques (GA-PID) puis l'apprentissage et l'adaptation en ligne avec les réseaux de neurones (NNPID). Pour le contrôle latéral, nous introduisons une technique de contrôle prédictif MPC adaptatif améliorée avec un nouvel algorithme PSO amélioré. Ensuite, nous réalisons l'adaptation en ligne des paramètres du contrôleur en utilisant les réseaux de neurones (NN-MPC) et les systèmes d'inférence neuro-flou adaptatif (ANFIS-MPC), qui apprennent à adapter le contrôleur aux conditions de fonctionnement et aux perturbations externes. Pour le contrôle latéral et longitudinal coordonné, nous proposons un PSO-PID pour la régulation de la vitesse, et un contrôleur prédictif de type LPV-MPC pour contrôler la dynamique latérale. Le LPV-MPC est développé avec une fonction de coût améliorée pour obtenir de meilleures performances et stabilité, il est aussi formulé avec un modèle LPV adaptatif, dans lequel les coefficients de rigidité de glissement latéral des pneus sont estimés par un estimateur récursif. Ensuite, nous abordons le contrôle couplé de la vitesse et de la direction en développant un contrôleur LPV-MPC plus élaboré et capable de gérer simultanément les dynamiques latérales et longitudinales du véhicule. De plus, le modèle de prédiction du LPV-MPC est adapté en temps réel par un réseau de neurones, et sa fonction de coût est encore optimisée par un algorithme génétique amélioré. Enfin, nous nous abordons le problème de course autonome où le véhicule roule à ses limites de maniabilité. Nous introduisons un contrôleur prédictif de modèle nonlinéaire en temps réel (NMPC) couplé avec un estimateur d'état de type (MHE). Nous résolvons le problème de course optimale par un planificateur de trajectoire hors ligne basé sur la méthode NMPC qui calcule la meilleure trajectoire tout en tenant compte des limites physiques du véhicule et des contraintes du circuit. Ensuite, nous améliorons encore la stratégie de contrôle en ajoutant une extension d'apprentissage basée sur la régression par processus de Gauss. Ce dernier améliore les prédictions NMPC en apprenant et en corrigeant le décalage entre la véritable dynamique du véhicule et le modèle de prédiction NMPC.