Thèse en cours

Définition d'une architecture pilotée par un système de propriétés temporelles pour la gestion de modèle IA avec renforcement learning.

FR  |  
EN
Auteur / Autrice : Mohamed El kharroubi
Direction : Fabrice Mourlin
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/11/2021
Etablissement(s) : Paris 12
Ecole(s) doctorale(s) : École doctorale Mathématiques, Sciences et Technologies de l'Information et de la Communication
Partenaire(s) de recherche : Laboratoire : LACL - Laboratoire d'Algorithmique, Complexité et Logique

Résumé

FR  |  
EN

L'apprentissage automatique (machine learning), est une forme d'intelligence artificielle (IA) qui permet à un système d'apprendre à partir des données et non à l'aide d'une programmation explicite. Cependant, l'apprentissage automatique n'est pas un processus simple. Au fur et à mesure que les algorithmes ingèrent les données d'apprentissage', il devient possible de créer des modèles plus précis basés sur ces données. Un modèle de machine learning est le résultat généré lorsque l'on entraîne un algorithme d'apprentissage automatique avec des données. Après cet entrainement, lorsque l'on fournit des données en entrée à un modèle, on reçoit une prédiction en sortie. Ainsi, l'apprentissage automatique nécessite d'appliquer un ensemble de données adéquat à un processus d'apprentissage. Avec le Big Data, il est désormais possible de virtualiser les données pour qu'elles puissent être stockées de la manière la plus efficace et la plus rentable pour l'apprentissage des modèles, que ce soit sur site ou dans le cloud. En outre, les améliorations de la vitesse et de la fiabilité du réseau ont fait disparaître d'autres limitations physiques liées à la gestion de quantités massives de données à une vitesse acceptable. Alors que nous sommes de plus en plus un contexte dicté par les données et l'analytique, les modèles d'apprentissage automatique sont devenus les principaux moteurs des décisions commerciales. Et comme pour toute autre stratégie d'entreprise, ces modèles doivent être révisés au fil du temps, la raison technique de cette révision étant la "dérive du modèle". Si la plupart des articles définissent le cycle de vie de l'apprentissage machine (ML), qui commence par la collecte de données et se termine par le déploiement du modèle ML dans l'environnement concerné [1], ils oublient une caractéristique très importante du cycle de vie ML, à savoir la dérive du modèle. En raison de cette dérive, le modèle devient instable et les prédictions continuent à être erronées avec le temps [2]. La dérive des modèles (ou drift) peut être classée en deux grandes catégories. Le premier type est appelé "dérive du concept". Cela se produit lorsque les propriétés statistiques de la variable cible elle-même changent. Si la signification même de la variable que nous essayons de prédire change, le modèle ne fonctionnera pas vraiment bien pour cette nouvelle définition. Le deuxième type, le plus courant, est la "dérive des données". Cela se produit lorsque les propriétés statistiques des prédicteurs changent. Là encore, si les variables sous-jacentes changent, le modèle est voué à l'échec. Un exemple classique de ce genre de situation est le changement des modèles de données en raison d'un événement capital (après le début d'une pandémie par exemple). Le besoin apparaît donc de mettre en place une architecture logicielle pour l'apprentissage tout au long de la vie d'un modèle IA [3] sans interruption de service.