Thèse soutenue

Analyse statistique des accidents routiers dans la région Franche-Comté : facteurs de risque pour la gravité de l'accident et modélisation spatiale de l'occurrence de l'accident

FR  |  
EN
Auteur / Autrice : Cécile Spychala
Direction : Camelia GogaClément Dombry
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 09/12/2022
Etablissement(s) : Bourgogne Franche-Comté
Ecole(s) doctorale(s) : École doctorale Carnot-Pasteur (Besançon ; Dijon ; 2012-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire de Mathématiques de Besançon (Besançon) - Laboratoire de Mathématiques de Besançon / LMB
Etablissement de préparaion : Université de Franche-Comté (1971-....)
Jury : Président / Présidente : Anne Gégout-Petit
Examinateurs / Examinatrices : Benjamin Taylor
Rapporteur / Rapporteuse : Marie Kratz, Anne Ruiz-Gazen

Résumé

FR  |  
EN

Dans cette thèse, nous nous intéressons à l’analyse statistique des données d’accidents routiers dans la région Franche-Comté. Plusieurs problématiques sont étudiées selon que l’on adopte un point de vue rétrospectif (analyse des facteurs de risques des accident déjà produits) ou prédictif (position spatiale et période temporelle les plus à risque). Pour ce faire, nous avons employé des méthodes de prédiction plutôt classiques d’apprentissage statistique et des outils de prédiction spatiale et spatio-temporelle. La première partie de la thèse est centrée sur l’analyse statistique de la gravité des accidents. De nombreux facteurs (tels que la consommation d’alcool et/ou drogues, le département, le moment de la journée) sont mis en relation avec la gravité de l’accident via des approches non-supervisées ou supervisées d’apprentissage statistique. La dépendance entre ces éléments est modélisée par des modèles log-linéaires proposés suite à une analyse préliminaire de correspondances multiples (ACM) et également par une régression logistique ordinale. Ces deux modélisations permettent de quantifier l’effet des différents facteurs de risques sur la gravité des accidents. La deuxième partie de la thèse porte sur la prédiction spatiale ou spatio-temporelle de la survenue d’un accident. Les données d’accidents sont modélisées par des processus de Cox log- Gaussiens (LGCP) basés sur les coordonnées géolocalisées des accidents ainsi que sur des covariables socio-démographiques et d’infrastructure routière afin d’identifier les zones géographiques les plus critiques. Nous proposons également une méthode de sélection de variables basée sur une aggrégation de modèles de Poisson et un critère d’importance de variables pour sélectionner les variables les plus importantes à incorporer dans le modèle LGCP. Le meilleur modèle est utilisé pour déterminer les zones les plus risquées. Dans un deuxième temps, la composante temporelle est ajoutée à l’étude et une modélisation semiparamétrique par modèle additif généralisé est proposée afin d’identifier les zones et périodes critiques. La modélisation s’inspire des études cas-contrôles épidémiologiques et prend en compte la structure du réseau routier ainsi que des données spatio-temporelles de densité de trafic.