Thèse en cours

Vers l'apprentissage de comportement de navire : prendre en considération les biais géographiques

FR  |  
EN

Accès à la thèse

AttentionLa soutenance a eu lieu en 2023. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Raphael Sturgis
Direction : Hachem KadriValentin EmiyaBasile Couëtoux
Type : Projet de thèse
Discipline(s) : Informatique
Date : Soutenance en 2023
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : École doctorale Mathématiques et Informatique de Marseille (Marseille ; 1994-....)
Partenaire(s) de recherche : Laboratoire : LIS Laboratoire d'Informatique et Systèmes
Jury : Président / Présidente : Frédéric BéCHET
Examinateurs / Examinatrices : Hachem Kadri, Laëtitia Chapel, Jean-Yves Tourneret, Kevin Tierney, Valentin Emiya
Rapporteur / Rapporteuse : Laëtitia Chapel, Jean-Yves Tourneret

Résumé

FR  |  
EN

Le système d’identification automatique (AIS) est un système de partage d’infor- mations qui permet aux navires commerciaux de communiquer entre eux et avec les services de trafic maritime (VTS). De ce fait, ce système produit de grandes quantités de données. Ces données peuvent être interprétées comme des séries temporelles décrivant la trajectoire des navires à travers leurs positions et d’autres variables telles que la vitesse ou le cap. Dans cette thèse, nous étudions différentes méthodes pour exploiter ces données afin d’améliorer le routage des navires et détecter leurs compor- tements. Une première contribution de ce travail est l’introduction d’une méthode pour générer des graphes routables qui permet de régler un seul paramètre afin d’obtenir des résultats satisfaisants pour une zone d’intérêt donnée. Au cours de ce travail, nous avons constaté que ces paramètres réglables nous permettaient d’améliorer la qualité des graphes routables produits dans certaines zones, mais que pour certains endroits de cette zone, un seul paramètre ne permettait pas d’obtenir des résultats satisfaisants partout. Afin de remédier à ce problème, nous proposons une méthode pour caractériser des zones afin de, par la suite, choisir les paramètres les mieux adaptés aux différentes zones. Par la suite, l’accent a été mis sur la détection du comportement des navires porte- conteneurs, par exemple lorsqu’un navire est à quai ou à la dérive, grâce à l’utilisation de différentes techniques d’apprentissage automatique. Lors du traitement des don- nées AIS, nous avons constaté que la géographie était un aspect majeur qui devait être pris en compte. En effet, la géographie permet de limiter les comportements susceptibles d’être présents dans une zone, mais peut également biaiser les modèles d’apprentissage automatique lorsque les données ne sont pas disponibles à l’échelle mondiale. La quantité limitée de données annotées disponibles est également un problème central à résoudre. L’une des contributions est la mise à disposition de la communauté de différents jeux de données de comportements des navires. L’une de nos contributions concernant la détection des comportements des navires est une méthode qui utilise la géographie à notre avantage pour améliorer la détection des comportements. Notre méthode permet d’entraîner différents modèles dans des zones spécifiques où la disponibilité de données étiquetées n’est pas un problème et de transférer ces connaissances dans des zones où aucune donnée étiquetée n’est disponible. Le choix des modèles à utiliser est fait en examinant la distribution des données non étiquetées disponibles dans la zone cible et en choisissant les modèles pour lesquels les distributions des données d’entraînement sont les plus similaires. Enfin, nous explorons également différentes méthodes pour supprimer les biais géographiques, intrinsèques aux données AIS, afin d’améliorer la détection des comportements. Nous explorons deux méthodes pour ce faire, la première basée sur l’ingénierie des caractéristiques et la seconde basée sur l’augmentation des données. Nous avons montré que notre méthode utilisant l’ingénierie des caractéristiques amé- liore les performances de nos différents modèles de détection de comportement. Nous profitons également de l’occasion pour comparer différents modèles adaptés à cette tâche.