Performances des modèles économétriques et de Machine Learning pour l’étude économique des choix discrets de consommation
Auteur / Autrice : | Nikita Gusarov |
Direction : | Iragaël Joly, Pierre Lemaire |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences économiques |
Date : | Soutenance le 19/02/2024 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale sciences économiques (Grenoble ; 1999-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'économie appliquée de Grenoble (2003-....) |
Jury : | Président / Présidente : Nadine Massard |
Examinateurs / Examinatrices : André de Palma, Michel Bierlaire, Michel Simioni | |
Rapporteur / Rapporteuse : André de Palma, Maria Börjesson |
Mots clés
Résumé
Cette thèse est une étude interdisciplinaire de la modélisation discrète des choix, abordant à la fois les techniques d'économétrie et d'apprentissage automatique (ML) appliquées à la modélisation des choix individuels de consommation. La problématique découle de points de contact insuffisants entre les utilisateurs (économistes et ingénieurs) et les analystes des données, qui poursuivent différents objectifs, bien qu'ils utilisent des techniques similaires. Pour combler cet écart interdisciplinaire, ce travail propose un framework unifié pour l'analyse des performances du modèle. Il facilite la comparaison des techniques d'analyse des données sous différentes hypothèses et transformations.Le framework conçu convient à une variété de modèles économétriques et ML. Il aborde la tâche de comparaison des performances du point de vue de la procédure de recherche, incorporant toutes les étapes affectant potentiellement les perceptions des performances. Pour démontrer les capacités du framework, nous proposons une série de 3 études appliquées. Dans ces études, la performance du modèle est explorée face aux changements de: (1) la taille et l'équilibre de l'échantillon, résultant de la collecte de données; (2) les changements de la structure des préférences au sein de la population, reflétant des hypothèses comportementales incorrectes; et (3) la sélection du modèle, directement liée à la perception des performances.