Thèse soutenue

Essais sur les tests de spécification et la sélection de modèles à variables instrumentales

FR  |  
EN
Auteur / Autrice : Hippolyte Boucher
Direction : Pascal Lavergne
Type : Thèse de doctorat
Discipline(s) : Sciences Economiques
Date : Soutenance le 19/04/2023
Etablissement(s) : Toulouse 1
Ecole(s) doctorale(s) : Toulouse School of Economics
Partenaire(s) de recherche : Equipe de recherche : TSE-R (Toulouse)
Jury : Président / Présidente : Eric Gautier
Examinateurs / Examinatrices : Frank Windmeijer, Bertille Antoine
Rapporteurs / Rapporteuses : Frank Windmeijer, Bertille Antoine

Résumé

FR  |  
EN

Cette thèse contient quatre chapitres sur les tests de spécifications et la sélection de modèles à variables instrumentales (IVs). Les IVs sont devenues un outil majeur en sciences sociales et en évaluation des politiques publiques car elles permettent d'estimer l'effet causal de variables endogènes sur des variables expliquées sans biais (due, par exemple, à des variables omises) en projetant ces variables endogènes sur les IVs. Pour que cette stratégie fonctionne, les IVs doivent être valides, autrement dit elles doivent être exogènes et significativement corrélées aux variables endogènes. Donc, dans cette thèse, j'élabore des tests et des méthodes pour sélectionner des modèles à IVs dans le but d'estimer le véritable effet causal d'une variable sur une autre. Sa contribution est importante car la littérature statistique et économétrique s'est principalement concentrée sur la sélection de modèle dans un but de prédiction et sur la sélection de modèles causaux dans des cas simples (modèle linéaire, classificateur binaire) sans IVs.Le premier chapitre s'appelle "A Pivotal Nonparametric Test for Identification-Robust Inference in Linear IV Models" et se fonde en grande partie sur les travaux de Antoine et Lavergne (2022). Dans celui-ci, je construis un test de spécification nonparamétrique pour modèle linéaire à IVs qui, après inversion, permet de faire de l'inférence sur l'effet causal homogène d'une ou plusieurs variables endogènes. Ce test a trois caractéristiques notables : Il est robuste aux problèmes d'IVs faibles, il capture toute l'information comprise dans les relations entre les IVs et les variables endogènes, et il est pivotal rendant la procédure très simple à appliquer.Le second chapitre s'appelle "Testing and Relaxing Distributional Assumptions on Random Coefficients in Demand Models" et est coécrit avec Gökçe Gökkoca et Max Lesellier. Dans ce chapitre, nous considérons un modèle de demande pour produits différenciés à IVs et à coefficients aléatoires et proposerons un test et une procédure de sélection de la distribution de ces coefficients aléatoires. Ces nouveaux outils sont une contribution significative car toute analyse contrefactuelle dépend de la validité de la spécification des coefficients aléatoires.Le troisième chapitre s'appelle "Selecting Strong and Exogenous Instruments via Structural Error Criteria". Dans celui-ci je considère le modèle linéaire à IVs et effet homogène et suppose que ces IVs ne sont pas forcément valides (ils peuvent être faibles et / ou endogènes) et je développe trois critères de sélection qui trouvent le sous-ensemble d'IVs valides. Ces méthodes de sélection se fondent sur la validation hors échantillon, en pratique validation croisée, ce chapitre est donc une contribution à la littérature en économétrie et en statistiques sur la sélection de modèle causal.Le quatrième et dernier chapitre est la vignette de la librairie "SpeTestNP" developée sur R en collaboration avec Pascal Lavergne qui m'a fourni son code. Cette librairie permet d'effectuer des tests nonparamétriques de spécifications paramétriques. Cinq tests robustes à l'hétéroscédasticité sont à disposition, Bierens (1982), Zheng (1996), Escanciano (2006), Lavergne et Patilea (2008), et Lavergne et Patilea (2012), avec de nombreuses options, notamment l'option calcul parallèle pour calculer rapidement des p-valeurs basées sur le bootstrap.