Apprentissage statistique sur données longitudinales de grande taille et applications au design des jeux vidéo

Thibault Allart

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Apprentissage statistique sur données longitudinales de grande taille et applications au design des jeux vidéo

FR |

EN

Auteur / Autrice :	Thibault Allart
Direction :	Stéphane Natkin, Agathe Guilloux
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 28/11/2017
Etablissement(s) :	Paris, CNAM
Ecole(s) doctorale(s) :	École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche :	Laboratoire : Centre d'études et de recherche en informatique et communications (Paris) - Laboratoire de statistique théorique et appliquée (Paris ; 2015-2017)
	Entreprise : Ubisoft (Saint-Mandé, Val-de-Marne, France)
Jury :	Président / Présidente : Aurélien Latouche
	Examinateurs / Examinatrices : Odile Limpach, Guillaume Levieux, Michel Pierfitte
	Rapporteur / Rapporteuse : Stéphane Canu, Cédric Buche

Mots clés

FR |

EN

Mots clés contrôlés

Modèles mathématiques

Analyse de survie (biométrie)

Apprentissage automatique

Mots clés libres

Apprentissage statistique

Analyse de survie

Jeux video

Optimisation

Résumé

FR |

EN

Cette thèse s'intéresse à l'analyse des données longitudinales, potentiellement grandes selon les trois axes suivants : nombre d'individus, fréquence d'observation et nombre de covariables. A partir de ces données, éventuellement censurées, nous considérons comme facteur d'étude le temps d'apparition d'un ou plusieurs évènements. Nous cherchons dans des classes de modèles à coefficients dépendant du temps à estimer l’intensité d’apparition des événements. Or les estimateurs actuels, ne permettent pas de traiter efficacement un grand nombre d’observations et/ou un grand nombre de covariables. Nous proposons un nouvel estimateur défini via la vraisemblance complète de Cox et une pénalisation permettant à la fois la sélection de variables et de forcer, quand c’est possible, les coefficients à être constants. Nous introduisons des algorithmes d'optimisation proximaux, permettant d'estimer les coefficients du modèle de manière efficace. L'implémentation de ces méthodes en C++ et dans le package R coxtv permet d'analyser des jeux de données de taille supérieure à la mémoire vive; via un streaming du flux de données et des méthodes d'apprentissage en ligne, telles que la descente de gradient stochastique proximale aux pas adaptatifs. Nous illustrons les performances du modèle sur des simulations en nous comparant aux méthodes existantes. Enfin, nous nous intéressons à la problématique du design des jeux vidéo. Nous montrons que l'application directe de ce modèle, sur les grands jeux de données dont dispose l'industrie du jeu vidéo, permet de mettre en évidence des leviers d'amélioration du design des jeux étudiés. Nous nous intéressons d'abord à l'analyse des composantes bas niveau, telles que les choix d'équipement fait par les joueurs au fils du temps et montrons que le modèle permet de quantifier l'effet de chacun de ces éléments de jeu, offrant ainsi aux designers des leviers d'amélioration direct du design. Enfin, nous montrons que le modèle permet de dégager des enseignements plus généraux sur le design tels que l'influence de la difficulté sur la motivation des joueurs.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Apprentissage statistique sur données longitudinales de grande taille et applications au design des jeux vidéo

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Apprentissage statistique sur données longitudinales de grande taille et applications au design des jeux vidéo

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses