Machine learning, données haute-fréquence et prévision économique

par Nicolas Woloszko

Thèse de doctorat en Sciences économiques - EM2PSI

Sous la direction de Laurence Jacquet.


  • Résumé

    L'apprentissage automatique a gagné du terrain en économie et a principalement été utilisé à la fois pour l'analyse structurelle (Mullainathan et Spiess, 2017[1]) ainsi que pour les prévisions économiques (Giannone, Lenza et Primiceri, 2018[2] ; Goulet Coulombe et al., 2019[3] ; Bontempi, Le Borgne et De Stefani, 2017[4] ; Ahmed et al., 2010[5] ; Edgerton et Weitzenfeld, 2018[6] ; Woloszko, 2020[7]) ou détection de point de retournement (Raffinot , 2016[7] ; Ng, 2014[8] ; Döpke, Fritsche et Pierdzioch, 2017[9] ; Bluwstein et al., 2019[10]). L'application d'outils de modélisation du domaine du machine learning aux questions économiques soulève de nouveaux défis et de nouvelles opportunités : • Interprétabilité. Les algorithmes d'apprentissage supervisé sont appelés « boîtes noires », alors que la plupart des applications économiques nécessitent une compréhension granulaire des modèles capturés par le modèle. L'interprétabilité est le sous-domaine de l'apprentissage automatique visant à extraire des informations à partir d'algorithmes. C'est un sujet de recherche brûlant en IA et il commence à y avoir des applications en économie (Renard et al., 2019[12] ; Joseph, 2019[13]). • Causalité. La plupart des algorithmes d'apprentissage supervisé, contrairement aux modèles linéaires, ne produisent pas d'estimations cohérentes des coefficients du modèle dans le cas des régressions avec facteurs de confusion. Des études causales exploitant des outils de machine learning ont commencé à se développer ces dernières années, et impliquent souvent des économètres (Chernozhukov et al., 2018[14] ; Chernozhukov et al., 2017[15] ; Wager et Athey, 2018[16] ; Athey et Imbens, 2016[17] ; Athey et Imbens, 2016[18]). La causalité est également un sujet de recherche brûlant en IA et à l'intersection des études causales en informatique (Pearl, 2019[19]), en apprentissage automatique et en économétrie (Imbens, 2019[19]). La présente proposition de thèse consiste en trois applications empiriques d'outils d'apprentissage automatique à des problèmes économiques en mettant l'accent sur l'interprétabilité de la causalité : la prédiction du risque de ralentissement, l'impact distributif des réformes du salaire minimum et la prévision immédiate de la croissance du PIB.

  • Titre traduit

    Machine learning, high-frequency data and nowcasting


  • Résumé

    Machine learning has gained currency in economics, and has mostly been used for both structural analysis (Mullainathan and Spiess, 2017[1]) as well as economic forecasting (Giannone, Lenza and Primiceri, 2018[2]; Goulet Coulombe et al., 2019[3]; Bontempi, Le Borgne and De Stefani, 2017[4]; Ahmed et al., 2010[5]; Edgerton and Weitzenfeld, 2018[6]; Woloszko, 2020[7]) or turning point detection (Raffinot, 2016[7]; Ng, 2014[8]; Döpke, Fritsche and Pierdzioch, 2017[9]; Bluwstein et al., 2019[10]). The application of modelling tools from the field of machine learning to economic questions raise new challenges and new opportunities: • Interpretability. Supervised learning algorithm are said to be “black boxes”, whereas most economics applications require a granular understanding of the patterns captured by the model. Interpretability is the subfield of machine learning aiming at extracting insights from algorithms. It is a hot research topic in AI and there starts to be applications in economics (Renard et al., 2019[12]; Joseph, 2019[13]). • Causality. Most supervised learning algorithm, unlike linear models, do not yield consistent estimates of model coefficients in the case of regressions with confounders. Causal studies exploiting machine learning tools have started to being developed in the past few years, and often involve econometricians (Chernozhukov et al., 2018[14]; Chernozhukov et al., 2017[15]; Wager and Athey, 2018[16]; Athey and Imbens, 2016[17]; Athey and Imbens, 2016[18]). Causality is a also hot research topic in AI and at the intersection of causal studies in computer sciences (Pearl, 2019[19]), machine learning and econometrics (Imbens, 2019[19]). The present thesis proposal consists in three empirical applications of machine learning tools to economic problems with a focus on interpretability of causality: downturn risk prediction, the distributional impact of minimum wage reforms and GDP growth nowcasting.