Estimation par approximation de Laplace dans les modèles GLM Mixtes : application à la gravité corporelle maximale des accidents de la route

par Fatima Meguellati

Thèse de doctorat en Mathématiques appliquées

Sous la direction de Assi N'Guessan et de Thierry Hermitte.

Soutenue le 07-02-2014

à Lille 1 , dans le cadre de École doctorale Sciences pour l'Ingénieur (Lille) , en partenariat avec Laboratoire Paul Painlevé (laboratoire) .


  • Résumé

    Cette thèse est une contribution à la construction de méthodes statistiques applicables à l’évaluation (modélisation et estimation) de certains indices utilisés pour analyser la gravité corporelle des accidents de la route. On se focalise sur quatre points lors du développement de la méthodologie adoptée : la sélection des variables (ou facteurs) présentant un effet aléatoire, la construction de modèles logistique-normaux mixtes, l’estimation des paramètres par approximation de Laplace et PQL (quasi-vraisemblance pénalisée), et la comparaison de la performance des méthodes d’estimation. Dans une première contribution, on construit un modèle logistique-Normal avec « Type de collision » comme variable à effet aléatoire pour analyser la gravité corporelle maximale observée dans un échantillon de véhicules accidentés. Des méthodes d’estimation fondées sur l’approximation de Laplace de la log-vraisemblance sont proposées pour estimer et analyser la contribution des variables présentes dans le modèle. On compare, par simulation, cette approximation Laplacienne à celle basée sur l’adaptation des polynômes de Gauss-Hermite (AGH). On montre que les deux approches sont équivalentes par rapport à la précision de l’estimation bien qu’AGH soit légèrement supérieure. Une deuxième contribution consiste à adapter certains algorithmes de la famille PQL à l’estimation des paramètres d’un deuxième modèle et à comparer sa performance en termes de biais aux méthodes de Laplace et AGH. Deux exemples de données simulées illustrent les résultats obtenus. Dans une troisième et dense contribution, on identifie plusieurs modèles logistique-normaux mixtes avec plus d’un effet aléatoire. La convergence numérique des algorithmes (Laplace, AGH, PQL) ainsi que la précision des estimations sont étudiées. Des simulations ainsi qu’une base de données détaillées d’accidents sont utilisées pour analyser la performance des modèles à détecter des véhicules contenant des usagers ayant des blessures graves corporelles maximales. Une programmation orientée R accompagnent l’ensemble des résultats obtenus. La thèse se termine sur des perspectives relatives aux critères de sélection de modèles GLM Mixtes et à l’extension de ces modèles à la famille multinomiale.

  • Titre traduit

    Estimation by Laplace approximation in GLM Mixed models : application to the maximum body severity of road crashes


  • Résumé

    This thesis is a contribution to the construction of statistical methods for the evaluation (modeling and estimation) of some indices used to analyze the injury severity of road crashes. We focus on four points during the development of the adopted methodology: the random variables (or factors) selection, the construction of mixed logistic-Normal model, the parameters estimation by Laplace approximation and PQL (penalized quasi-likelihood) and the performance comparison of the estimation methods. In a first contribution, a logistic-Normal model is constructed with "collision type" as random variable to analyze the maximum injury severity observed in a sample of crashed vehicles. Estimation methods based on the Laplace approximation of the log-likelihood are proposed to estimate and analyze the contribution of variables in the model. We compare, by simulation, this Laplacian approximation to those based on the adaptation of Gauss-Hermite polynomials (AGH). We show that the two approaches are equivalent with respect to the accuracy of the estimate although AGH is superior. A second contribution is to adapt some algorithms of PQL family to estimate the parameters of a second model and compare its performance to Laplace and AGH methods in terms of bias. Two examples of simulated data illustrate the obtained results. In a third and dense contribution, we identify several mixed logistic-Normal models with more than one random effect. The convergence of the algorithms (Laplace, AGH, and PQL) and the precision of the estimates are investigated. Simulations as well as a database of detailed crash data are used to analyze the models performance to detect vehicles containing users with maximum injury severity. Programming oriented R accompany all results. The thesis concludes with perspectives on GLM Mixed models selection criteria and the extension of these models to the multinomial family.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université des sciences et technologies de Lille. Service commun de la documentation. Bibliothèque virtuelle.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.