Thèse soutenue

Analyse des marchés avec les données en ligne : combinaison de l'apprentissage machine et de l'économétrie

FR  |  
EN
Auteur / Autrice : Gilles Hacheme
Direction : Bruno DecreuseEmmanuel Flachaire
Type : Thèse de doctorat
Discipline(s) : Sciences économiques
Date : Soutenance le 04/07/2022
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : École Doctorale Sciences économiques et de destion d'Aix-Marseille (Aix-en-Provence)
Partenaire(s) de recherche : Equipe de recherche : Aix-Marseille School of Economics
Jury : Président / Présidente : François-Charles Wolff
Examinateurs / Examinatrices : Pierre Michel
Rapporteurs / Rapporteuses : Elena Dumitrescu

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Les méthodes d'apprentissage automatique (ML) deviennent courantes dans de nombreuses sciences pour la modélisation de données massives. En effet, l'adoption croissante d'internet entraîne une croissance exponentielle des données générées en ligne. La compréhension des marchés économiques sous-jacents nécessite de nouvelles techniques et de nouveaux outils. Les interfaces de programmation d'applications (APIs) et les techniques de web scraping sont aujourd'hui nécessaires pour la collecte de données en ligne. Dans le même temps, le ML a fourni une gamme étendue d'outils pour extraire des informations de ces données massives et complexes. Cependant, l'adoption du ML en Economie est encore limitée, principalement en raison de son manque d'interprétabilité. Dans cette thèse, nous faisons quelques applications pratiques de l'utilisation de données massives en ligne pour résoudre des problèmes économiques tout en utilisant et en suggérant des méthodes interprétables. Au chapitre 1, nous utilisons plus de 300.000 offres d'emploi de Pôle Emploi pour comprendre pourquoi les employeurs choisissent de négocier les salaires avec les demandeurs d'emploi. Au chapitre 2, nous développons une méthode pour extraire des indicateurs de sentiment d’articles de presse et les décomposer en plusieurs dimensions appelées aspects. Nous appliquons notre méthode à près de 600.000 articles de presse pour construire des indicateurs économiques précoces comme outils supplémentaires à la prise de décision. Au chapitre 3, nous proposons une nouvelle classe de modèles économétriques qui rivalisent avec les modèles de ML sur des ensembles de données standard tout en étant beaucoup plus interprétables.