Estimation par approximation de Laplace dans les modèles GLM Mixtes : application à la gravité corporelle maximale des accidents de la route
Auteur / Autrice : | Fatima Meguellati |
Direction : | Assi N'Guessan, Thierry Hermitte |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 07/02/2014 |
Etablissement(s) : | Lille 1 |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur (Lille) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Paul Painlevé |
Résumé
Cette thèse est une contribution à la construction de méthodes statistiques applicables à l’évaluation (modélisation et estimation) de certains indices utilisés pour analyser la gravité corporelle des accidents de la route. On se focalise sur quatre points lors du développement de la méthodologie adoptée : la sélection des variables (ou facteurs) présentant un effet aléatoire, la construction de modèles logistique-normaux mixtes, l’estimation des paramètres par approximation de Laplace et PQL (quasi-vraisemblance pénalisée), et la comparaison de la performance des méthodes d’estimation. Dans une première contribution, on construit un modèle logistique-Normal avec « Type de collision » comme variable à effet aléatoire pour analyser la gravité corporelle maximale observée dans un échantillon de véhicules accidentés. Des méthodes d’estimation fondées sur l’approximation de Laplace de la log-vraisemblance sont proposées pour estimer et analyser la contribution des variables présentes dans le modèle. On compare, par simulation, cette approximation Laplacienne à celle basée sur l’adaptation des polynômes de Gauss-Hermite (AGH). On montre que les deux approches sont équivalentes par rapport à la précision de l’estimation bien qu’AGH soit légèrement supérieure. Une deuxième contribution consiste à adapter certains algorithmes de la famille PQL à l’estimation des paramètres d’un deuxième modèle et à comparer sa performance en termes de biais aux méthodes de Laplace et AGH. Deux exemples de données simulées illustrent les résultats obtenus. Dans une troisième et dense contribution, on identifie plusieurs modèles logistique-normaux mixtes avec plus d’un effet aléatoire. La convergence numérique des algorithmes (Laplace, AGH, PQL) ainsi que la précision des estimations sont étudiées. Des simulations ainsi qu’une base de données détaillées d’accidents sont utilisées pour analyser la performance des modèles à détecter des véhicules contenant des usagers ayant des blessures graves corporelles maximales. Une programmation orientée R accompagnent l’ensemble des résultats obtenus. La thèse se termine sur des perspectives relatives aux critères de sélection de modèles GLM Mixtes et à l’extension de ces modèles à la famille multinomiale.