Analyse des marchés avec les données en ligne : combinaison de l'apprentissage machine et de l'économétrie
Auteur / Autrice : | Gilles Hacheme |
Direction : | Bruno Decreuse, Emmanuel Flachaire |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences économiques |
Date : | Soutenance le 04/07/2022 |
Etablissement(s) : | Aix-Marseille |
Ecole(s) doctorale(s) : | École Doctorale Sciences économiques et de destion d'Aix-Marseille (Aix-en-Provence) |
Partenaire(s) de recherche : | Equipe de recherche : Aix-Marseille School of Economics |
Jury : | Président / Présidente : François-Charles Wolff |
Examinateurs / Examinatrices : Pierre Michel | |
Rapporteurs / Rapporteuses : Elena Dumitrescu |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Les méthodes d'apprentissage automatique (ML) deviennent courantes dans de nombreuses sciences pour la modélisation de données massives. En effet, l'adoption croissante d'internet entraîne une croissance exponentielle des données générées en ligne. La compréhension des marchés économiques sous-jacents nécessite de nouvelles techniques et de nouveaux outils. Les interfaces de programmation d'applications (APIs) et les techniques de web scraping sont aujourd'hui nécessaires pour la collecte de données en ligne. Dans le même temps, le ML a fourni une gamme étendue d'outils pour extraire des informations de ces données massives et complexes. Cependant, l'adoption du ML en Economie est encore limitée, principalement en raison de son manque d'interprétabilité. Dans cette thèse, nous faisons quelques applications pratiques de l'utilisation de données massives en ligne pour résoudre des problèmes économiques tout en utilisant et en suggérant des méthodes interprétables. Au chapitre 1, nous utilisons plus de 300.000 offres d'emploi de Pôle Emploi pour comprendre pourquoi les employeurs choisissent de négocier les salaires avec les demandeurs d'emploi. Au chapitre 2, nous développons une méthode pour extraire des indicateurs de sentiment d’articles de presse et les décomposer en plusieurs dimensions appelées aspects. Nous appliquons notre méthode à près de 600.000 articles de presse pour construire des indicateurs économiques précoces comme outils supplémentaires à la prise de décision. Au chapitre 3, nous proposons une nouvelle classe de modèles économétriques qui rivalisent avec les modèles de ML sur des ensembles de données standard tout en étant beaucoup plus interprétables.