Thèse soutenue

Apprentissage, prédiction et optimisation des apports énergétiques pour un bâtiment à faible impact environnemental

FR  |  
EN
Auteur / Autrice : Louis Desportes
Direction : Inbar Fijalkow
Type : Thèse de doctorat
Discipline(s) : STIC (Sciences et Technologies de l'Information et de la Communication) - ED EM2PSI
Date : Soutenance le 16/12/2022
Etablissement(s) : CY Cergy Paris Université
Ecole(s) doctorale(s) : École doctorale Économie, Management, Mathématiques, Physique et Sciences Informatiques (Cergy-Pontoise, Val d'Oise)
Partenaire(s) de recherche : Laboratoire : Equipes Traitement de l'Information et Systèmes (Cergy-Pontoise, Val d'Oise ; 2002-....)
Jury : Examinateurs / Examinatrices : Inbar Fijalkow, Damien Ernst, Emmanuel Daucé, Marie-Cécile Péra, Adrien Jeantet, Nicolas Bredèche, Pierre Andry
Rapporteurs / Rapporteuses : Damien Ernst, Emmanuel Daucé

Résumé

FR  |  
EN

Afin d'atténuer le changement climatique nous devons baisser nos émissions de gaz à effet de serre, principalement de CO_2, notamment en passant à des énergies bas carbone comme les panneaux solaires. Toutefois, l'intermittence de telles sources d'énergies implique de mettre en place des méthodes de stockage (ESS) pour alimenter les usages avec des besoins continus en énergie comme un centre de données ou un bâtiment. Pour minimiser l'impact carbone d'un tel stockage, il a été proposé d'utiliser un stockage hybride (HESS) batterie-hydrogène. On cherche donc à contrôler ce stockage hybride à l'aide d'apprentissage par renforcement profond (DRL) dans un but de minimisation de l'impact carbone. Nous commençons par proposer un prédicteur de température à venir afin de préciser la consommation à venir, et d'irradiance, pour prédire la production des panneaux solaire. Ensuite nous formulons le problème de stockage d'énergie à une batterie avant de le résoudre de manière instantanée. La solution instantanée n'étant pas adaptée à la gestion à long-terme, nous reformulons notre problème dans le cadre de l'apprentissage par renforcement (RL) pour apprendre une politique à même d'alimenter le centre de données plusieurs mois. Nous proposons une reformulation du problème à deux batteries pour utiliser l'apprentissage par renforcement profond avant de réduire l'espace d'action à une variable pour produire une politique tenant toute l'année tout en minimisant l'impact carbone. Nous ajoutons des informations temporelles afin de permettre à la politique de prendre en compte les cycles temporels. Cet ajout nous permet de réduire encore plus l'impact carbone du stockage. Enfin nous étudions la robustesse de notre solution aux erreurs de prédiction du prédicteur