Thèse soutenue

Améliorer la conception des études sur les effets à court terme de la pollution de l’air sur la santé

FR  |  
EN
Auteur / Autrice : Léo Zabrocki
Direction : Hélène Ollivier
Type : Thèse de doctorat
Discipline(s) : Analyse et politique économiques
Date : Soutenance le 17/06/2022
Etablissement(s) : Paris, EHESS
Ecole(s) doctorale(s) : École doctorale d'Économie (Paris)
Jury : Président / Présidente : Katheline Schubert
Examinateurs / Examinatrices : Katheline Schubert, Michela Baccini, Tatyana Deryugina, Sylvain Chabé-Ferret, Clément de Chaisemartin
Rapporteurs / Rapporteuses : Michela Baccini, Tatyana Deryugina

Résumé

FR  |  
EN

L’objectif de cette thèse est d’améliorer la conception des études observationnelles sur les effets à court terme de la pollution de l’air sur la santé. Dans le premier chapitre écrit avec Anna Alari et Tarik Benmarhnia, nous préconisons d’utiliser des méthodes d’appariement pour améliorer la phase de conception des études qui exploitent les changements de direction du vent comme variables instrumentales. Nous montrons que les directions du vent sont fortement reliées à des facteurs de confusion et qu’il y a souvent peu d’observations contrefactuelles pour comparer l’effet propre à chaque direction. A l’aide d’une analyse de sensibilité, nous montrons aussi, de manière quantitative, que les effets des directions du vent sur les concentrations des polluants aériens ne sont pas biaisés par l’existence d’un facteur inobservé. Notre approche pourrait être pertinente pour des stratégies similaires fondées sur des instruments binaires comme les inversions thermiques ou les grèves de transports publics. Dans le deuxième chapitre rédigé avec Marion Leroutier et Marie-Abèle Bind, nous étudions l’impact du trafic de croisière sur la pollution de l’air à Marseille. Avec une méthode d’appariement conçue pour les séries temporelles, nous créons des expériences hypothétiques et estimons l’effet à court terme d’une augmentation du trafic maritime sur la pollution de l’air. Nous utilisons aussi l’inférence par randomisation, ce qui permet d’éviter de faire des approximations asymptotiques et des hypothèses sur la forme de la distribution de la statistique test. Nous trouvons que l’arrivée de navires de croisière augmente au niveau de la ville les concentrations de dioxyde d’azote ainsi que des particules fines. Nos résultats suggèrent que des expériences hypothétiques permettent de mieux comprendre les externalités négatives du trafic maritime. Dans le troisième chapitre, nous expliquons avec Vincent Bagilet que la combinaison d’un biais de publication en faveur des résultats statistiquement significatifs et d’un manque de puissance statistique pourrait produire des effets surestimés de la pollution de l’air sur la santé. Nous rassemblons d’abord l’ensemble des effets estimés et leur erreur type publiés en épidémiologie et en économie. En utilisant des calculs de puissance statistique, nous montrons que cette puissance est inférieure à 80% pour la moitié des articles et qu’ils pourraient donc produire des effets deux fois trop grands. Nous menons ensuite des simulations sur des vraies données pour identifier les paramètres qui affectent la puissance statistique. Nous trouvons que le nombre de chocs exogènes ainsi que le nombre de cas journaliers de décès ou d’admissions en urgence influencent fortement la puissance. Ces résultats sont importants car de nombreuses études exploitent de rares chocs exogènes et se concentrent sur des sous-groupes comme les enfants ou les personnes âgées. A la fin du chapitre, nous proposons plusieurs recommandations pour prendre en compte ce problème négligé de puissance statistique. Le quatrième et dernier chapitre est une généralisation du troisième chapitre. Pour surmonter le biais de confusion, les études quasi-expérimentales se concentrent sur des sources spécifiques de variation du traitement. Cela peut alors entraîner une perte de puissance statistique. Les effets publiés peuvent cependant surestimer la taille des vrais effets quand la puissance est faible. A l’aide de simulations sur des fausses données, nous montrons avec Vincent Bagilet que toutes les méthodes d’inférence causale font face à un compromis entre le biais de confusion et l’exagération du vrai effet à cause d’un manque de puissance. Nous expliquons à la fin du chapitre que les calculs de puissance et les analyses de sensibilité pourraient permettre de mieux prendre en compte cette tension.