Apprentissage à Haut Niveau pour la conduite automatique des Navires en zone dense.
Auteur / Autrice : | Raphael Teitgen |
Direction : | Bruno Monsuez |
Type : | Projet de thèse |
Discipline(s) : | Informatique, données, IA |
Date : | Soutenance en 2024 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de l'Institut polytechnique de Paris |
Partenaire(s) de recherche : | Laboratoire : U2IS - Unité d'Informatique et d'Ingénierie des Systèmes |
Equipe de recherche : SAR - Systèmes Autonomes et Robotique | |
Jury : | Président / Présidente : Luc Jaulin |
Examinateurs / Examinatrices : Bruno Monsuez, Guillaume Delefortrie, Engelbert Mephu nguifo, Romain Kukla, Javier Ibanez-guzman | |
Rapporteurs / Rapporteuses : Luc Jaulin, Guillaume Delefortrie |
Mots clés
Résumé
Dans les zones maritimes à trafic dense, l'assurance de la sécurité navale demeure la priorité absolue de tout système de navigation autonome. Malgré l'existence de méthodes exactes, elles peinent à offrir une solution universelle, leur application restant souvent limitée à des situations particulières. Cette thèse propose l'élaboration d'une fonction décisionnelle générique basée sur l'apprentissage par renforcement, afin de permettre à un USV d'évoluer dans un milieu densément peuplé d'obstacles fixes et mobiles. Ce modèle devrait donc apprendre à atteindre son objectif tout en naviguant dans un environnement chaotique avec un risque de collision élevé. Pour ce faire, nous proposons que la perception environnementale de l'USV se réalise par l'intermédiaire d'une grille de collisions. Selon les mouvements des divers obstacles, des zones d'attraction seraient mises en place pour définir des zones de navigation pondérées sur cette grille. Nous proposons aussi d'intégrer les COLREGs dans cette grille, afin d'obliger l'USV à respecter les normes de navigation actuelles. Des travaux supplémentaires ont également été consacrés à la vérification de l'application adéquate de ces règles dans des scénarios précis, basés sur les problèmes d'Imazu. Dans le but d'améliorer la stabilité et la prise de décision du modèle prédictif, l'introduction de mécanismes d'attention dans des zones d'observation spécifiques est proposée, ainsi qu'un système de vote inter-modèles pour homogénéiser et corriger les décisions individuelles. Enfin, nous proposons d'évaluer la robustesse du modèle face à des attaques externes, ainsi que la mise en uvre de stratégies de défense contre ces menaces potentielles grâce à des entraînements adverses.