Thèse en cours

L'apprentissage coopératif et interactif à domicile pour mieux engager les habitants des immeubles résidentiels dans l'amélioration quotidienne de leurs propres pratiques
FR  |  
EN
Auteur / Autrice : Estefania Alvarez del castillo cardoso
Direction : Stéphane PloixPatrick Reignier
Type : Projet de thèse
Discipline(s) : Automatique - Productique
Date : Inscription en doctorat le 01/10/2021
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale électronique, électrotechnique, automatique, traitement du signal (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Sciences pour la conception, l'optimisation et la production (Grenoble)

Résumé

FR  |  
EN

Sujet de thèse, dans le cadre du projet d'apprentissage ANR 2021 Titre : Apprentissage coopératif et interactif à domicile pour mieux engager les habitants des immeubles résidentiels dans l'amélioration quotidienne de leurs propres pratiques. Durée : 3 ans Lieu : Laboratoire G-SCOP et équipe LIG/APTIKAL École doctorale : EEATS spécialité Automatique Superviseurs : (dir. 25%) stephane.ploix@grenoble-inp.fr, (enc. 50%) manar.amyri@grenoble-inp.fr, (dir 25%) patrick.reignier@imag.fr Signature : Stéphane Ploix Contexte : Le projet de thèse part des résultats clés du projet INVOLVED mais en se concentrant sur la limitation suivante : chaque site est unique de par son architecture, ses équipements et ses capteurs mais aussi de par ses occupants. Les modèles de sites, y compris les emplacements des capteurs et les activités/préférences humaines utilisés dans INVOLVED ne sont généralement pas disponibles. Par conséquent, une approche alternative doit être conçue en considérant que la connaissance du site résulte d'une confrontation symétrique entre la connaissance des occupants et la connaissance d'un système artificiel, appelé Interactive Home Energy Management Aid System (IHEMAS). Chaque partie informe, explique, demande, suggère et apprend de l'autre de manière symétrique. Dans [1], nous avons montré une première application d'une co-définition symétrique des activités où les occupants décrivent quotidiennement ce qu'ils font avec leurs propres étiquettes significatives et l'IHEMAS analyse si ces étiquettes peuvent correspondre à sa propre perception basée sur les données du capteur et, si non, il suggère une étiquette d'activité plus globale ou des erreurs d'étiquetage en fonction du contexte. Dans LearningHome, nous voulons aller plus loin en (1) découvrant activement les comportements non Pareto-optimaux des occupants concernant les compromis coûts/conforts en amenant les occupants à explorer l'espace des actions possibles et en générant des explications causales dynamiques contextuelles [2] (2) validant l'efficacité de l'approche en la comparant à différentes méthodes de tarification et/ou de facturation, d'implication par des approches de jeu, de fourniture aux habitants de rapports réguliers sur l'énergie et l'activité de la maison. Pour aborder ces deux questions, le travail a été divisé en trois fronts de recherche : RF1 se concentre sur les algorithmes d'apprentissage interactif/coopératif, RF2 sur la conception de tableaux de bord contrôlables par l'utilisateur avec une plasticité dynamique engageant l'utilisateur dans un apprentissage interactif/coopératif et RF3, sur la validation expérimentale comparant les impacts sur les comportements des occupants de différentes approches allant de l'approche purement économique à l'approche d'apprentissage coopératif actif. État de l'art : Les techniques d'apprentissage semi-supervisé appliquées dans [1] représentent une approche d'apprentissage visant à résoudre le problème de la reconnaissance des activités. Elles exploitent les données non étiquetées afin d'améliorer les performances du modèle. Par exemple, [2] présente une méthode de reconnaissance de l'activité humaine qui tire parti de la structure et des propriétés séquentielles des données d'apprentissage et de test. Dans la phase d'apprentissage, une fraction des étiquettes de données a été obtenue et utilisée dans une méthode semi-supervisée pour reconnaître les activités de l'utilisateur. La propagation des étiquettes a été utilisée sur un graphe de K-voisins les plus proches pour calculer la probabilité des données non étiquetées dans chaque classe de la phase de formation. Ces probabilités ont été utilisées pour entraîner un HMM de manière à ce que chacun de ses états cachés corresponde à une classe d'activité. Certaines approches semi-supervisées sont également basées sur l'apprentissage actif. Par exemple, différentes stratégies d'apprentissage actif ont été étudiées dans [3]. En particulier, une approche dynamique de regroupement par k-means a été proposée pour découvrir spontanément de nouvelles activités non vues. Ces activités non vues sont détectées comme des valeurs aberrantes qui rendent l'algorithme de clustering sensible au nombre de clusters qui peut augmenter à chaque itération. L'erreur globale de clustering a été enregistrée en utilisant une fonction d'erreur sur l'ensemble des clusters définie comme la somme des distances euclidiennes entre les différentes instances de données et les centres des clusters. Une fonction objective basée sur l'entropie est ensuite définie pour récupérer les instances de données les plus informatives. Les activités considérées sont la cuisine, le balayage, le lavage et le nettoyage, qui ont été utilisées pour l'apprentissage passif. Trois autres activités, à savoir manger, dormir et parler au téléphone, ont été laissées à l'apprentissage actif. Certaines approches récentes sont basées sur l'apprentissage par transfert L'apprentissage actif est un outil important pour de nombreuses applications en temps réel. L'idée principale de l'apprentissage actif est qu'un algorithme d'apprentissage automatique peut obtenir une plus grande précision avec moins d'étiquettes d'apprentissage si on lui permet de déterminer les données à partir desquelles il apprend, [5], [6]. Afin d'éviter de collecter des données à partir de zéro et de perturber la vie quotidienne des utilisateurs, certaines approches de reconnaissance d'activité ont été basées sur l'apprentissage par transfert. L'idée principale consiste à transférer autant que possible les connaissances acquises d'un environnement existant, appelé domaine source, vers un nouveau domaine cible (c'est-à-dire l'environnement où les connaissances sont appliquées) afin de réduire l'effort de collecte de données. Il convient de noter que dans l'apprentissage par transfert, les ensembles de caractéristiques, les ensembles d'étiquettes ainsi que les tâches d'apprentissage dans les ensembles de données des domaines source et cible peuvent être différents. Les approches de l'apprentissage par transfert peuvent être classées grossièrement en trois groupes : les techniques de transfert basées sur les instances, les caractéristiques et les paramètres. Certaines approches récentes sont basées sur l'apprentissage par transfert. Dans [7], par exemple, les auteurs ont proposé une approche basée sur les caractéristiques pour réutiliser les connaissances apprises dans un environnement d'origine et l'ont testée avec succès pour extraire et transférer les connaissances entre deux environnements de maison intelligente différents en ne considérant que des scénarios à un seul résident. Le problème a été formulé comme une tâche de classification utilisant un SVM en faisant correspondre les différentes caractéristiques des environnements source et cible. Deux cas ont été considérés. Dans le premier, les ensembles de données étiquetées des deux environnements sont supposés être disponibles. Dans le second, les données étiquetées ne sont disponibles que dans l'environnement source et les informations provenant de l'environnement cible sont limitées au déploiement de capteurs considérés comme des connaissances de base. Une approche d'apprentissage interactif a été étudiée pour estimer l'occupation avec un ensemble de capteurs et l'auto-étiquetage par les occupants [8, 9]. L'apprentissage interactif estime le nombre d'occupants en interrogeant les occupants lorsque cela est pertinent, en limitant le nombre d'interactions et en maximisant l'utilité des informations sur l'occupation réelle. Les algorithmes d'estimation de l'occupation utilisent les informations recueillies auprès des occupants ainsi que des capteurs communs. L'approche d'apprentissage interactif dépend principalement de la méthodologie d'interaction pour définir quand il est nécessaire d'interroger les occupants. La densité du voisinage, l'estimation de l'erreur moyenne et le poids de chaque classe sont utilisés pour définir le moment opportun pour interagir avec les utilisateurs finaux. Les résultats conduisent à la conclusion que l'approche interactive est plus efficace pour l'estimation de l'occupation que les autres méthodes prenant en compte le contexte. Dans [10], une approche d'apprentissage interactive est proposée pour estimer le nombre d'occupants d'une pièce en interrogeant les occupants lorsque cela est pertinent, en introduisant le concept de qualité des données pour évaluer la qualité des étiquettes de collecte et le processus d'interaction. IN [11] présente une version raffinée du concept de capteurs virtuels intelligents dynamiques (DIVS). L'un des principaux raffinements du concept original est d'inclure l'apprentissage automatique interactif, en introduisant l'utilisateur dans la boucle afin d'améliorer la précision et de minimiser la nécessité de données étiquetées. Dans [12], les auteurs étudient différentes stratégies d'apprentissage proactif, qui explorent les facteurs humains de l'oracle et les aspects qui pourraient influencer un utilisateur à fournir ou à refuser des étiquettes. Dans [13], les auteurs présentent une première étape vers une taxonomie des stratégies d'apprentissage interactif dans un cadre multimodal et dynamique. En relâchant les hypothèses de l'apprentissage actif standard, les stratégies deviennent mieux adaptées aux contextes du monde réel et peuvent atteindre de meilleures performances. Objectif : des approches interactives et coopératives, avec des tableaux de bord engageants pour encourager et maintenir les changements de comportements des habitants. Des raisonnements innovants basés sur des cas concrets ainsi que des tableaux de bord engageants, interactifs et coopératifs, vont être développés et testés. En fonction des approches, l'évaluation sera faite soit avec quelques maisons expérimentales avec une forte densité de capteurs (avec une étude de ce qui est possible en réduisant le nombre de capteurs), soit avec de nombreuses maisons (typiquement 100 à 200) dans des bâtiments collectifs avec un nombre limité de capteurs. References: [1] B. M. Shahshahani and D. A. Landgrebe, “The effect of unlabelled samples in reducing the small sample size problem and mitigating the Hughes phenomenon,” IEEE Transactions on Geoscience and Remote Sensing, vol. 32, no. 5, pp. 1087–1095, Sep. 1994. [2] M.Stikic, D.Larlus, and B.Schiele,“Multi-graph based semi-supervised learning for activity recognition,” in 2009 International Symposium on Wearable Computers, Sep. 2009, pp. 85–92. [3] H. M. S. Hossain, M. A. A. H. Khan, and N. Roy, “Active learning enabled activity recognition,” Pervasive and Mobile Computing, vol. 38, pp. 312 – 330, 2017, special Issue IEEE International Conference on Pervasive Computing and Communications (PerCom) 2016. [4] H M Sajjad Hossain and Nirmalya Roy. 2019. Active Deep Learning for Activity Recognition with Context Aware Annotator Selection. In Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (KDD '19). Association for Computing Machinery, New York, NY, USA, 1862–1870. DOI:https://doi.org/10.1145/3292500.3330688 [5] S. Tong, E. Chang, Support vector machine active learning for image retrieval, in: Proceedings of the Ninth ACM International Conference on Multimedia, in: MULTIMEDIA '01, ACM, New York, NY, USA, 2001, pp. 107–118, doi:10.1145/ 500141.500159. [6] Alemdar, H., van Kasteren, T. and Ersoy, C. (2017) Active learning with uncertainty sampling for large scale activity recognition in smart homes. Journal of Ambient Intelligence and Smart Environments, 9, 209–223. [7] Y. Chiang, C. Lu, and J. Y. Hsu, “A feature-based knowledge transfer framework for cross- environment activity recognition toward smart home applications,” IEEE Transactions on Human-Machine Systems, vol. 47, no. 3, pp. 310–322, 2017. [8] M. Amayri, S. Ploix, N. Bouguila, F. Wurtz, Estimating occupancy using interactive learning with a sensor environment: real-time experiments, IEEE Access 7 (2019) 53932–53944. [9] M. Amayri, S. Ploix, P. Reignier, S. Bandyopadhyay, Towards interactive learning for occupancy estimation, in: ICAI'16 - International Conference on Artificial Intelligence, Las Vegas, United States, 201. URL https://hal.archives-ouvertes.fr/hal-01407401 [10] M. Amayri, S. Ploix, N. Bouguila, and F.Wurtz,“Data base quality assessment for interactive learning: Application to occupancy estimation,” Energy and Buildings, vol. 209, p. 109578, 2020. [11] Tegen A, Davidsson P, Mihailescu RC, Persson JA (2019) Collaborative sensing with interactive learning using dynamic intelligent virtual sensors. Sensors 19(3):477 [12] Tegen A, Davidsson P, Persson JA (2019) Interactive machine learning for the internet of things: a case study on activity detection. In: Proceedings of IoT'19: International Conference on the Internet of Things (IoT'19). ACM [13] Tegen A, Davidsson P, Persson JA (2019) Towards a taxonomy of interactive continual and multimodal learning for the internet of things. In: Adjunct Proceedings of the 2019 ACM International Joint Conference on Pervasive and Ubiquitous Computing and Proceedings of the 2019 International Symposium on Wearable Computers. ACM, pp 524–528