Construire le jumeau numérique d'une station d'épuration en traitant les données industrielles haute-fréquence pour prédire la qualité des eaux résiduaires urbaines par un modèle d'apprentissage automatique
| Auteur / Autrice : | Nabil Ferikh |
| Direction : | Stéphane Mottelet, Arnaud Dujany (coutu) |
| Type : | Projet de thèse |
| Discipline(s) : | Génie des procédés |
| Date : | Inscription en doctorat le 24/09/2024 |
| Etablissement(s) : | Compiègne |
| Ecole(s) doctorale(s) : | Sciences pour l'ingénieur |
| Partenaire(s) de recherche : | Laboratoire : Transformations intégrées de la matière renouvelable |
Mots clés
Résumé
Les eaux résiduaires industrielles, les eaux de pluie ainsi que les eaux domestiques sont aujourd'hui récupérées par un réseau de transport des eaux usées qui les amène aux usines d'épuration via des collecteurs. L'eau subit alors une succession d'étapes de traitements physiques, chimiques et biologiques avant d'être contrôlée et rejetée dans la rivière. Les boues provenant de ces traitements sont quant à elles valorisées thermiquement, par méthanisation ou bien pour l'agriculture. Ce long parcours de l'eau à assainir est constitué de nombreuses étapes et les débits d'eau en entrée et en sortie de station sont soumis à une forte variabilité, due notamment aux conditions climatiques, à la saisonnalité et aux conditions d'exploitation. Ces conditions rendent toute prédiction à moyen et long terme difficile. La modélisation numérique est un outil puissant permettant, selon les besoins, de prédire, d'optimiser ou encore de mieux comprendre un processus. La modélisation de l'ensemble du parcours de l'eau pourrait être réalisée grâce au développement de modèles phénoménologiques pour chaque étape du processus afin de prédire l'ensemble, mais ce modèle serait lourd à calibrer du fait de la complexité de chaque opération unitaire ainsi que la variabilité des paramètres opératoires dans le temps, ce qui rendrait cette approche très longue et complexe à mettre en uvre avec un fort risque d'erreur. Il est alors nécessaire d'explorer d'autres pistes de recherche pour permettre le développement d'un modèle fiable et facile à calibrer. L'apprentissage automatique est une méthode de modélisation statistique du domaine de l'intelligence artificielle et de la science des données permettant de réaliser des prédictions fiables par apprentissage à partir de données mesurées. Il est possible de coupler une prise de mesure en temps réel et un algorithme d'apprentissage automatique afin de créer un modèle virtuel de la station d'épuration : un jumeau numérique. En comparaison avec les modélisations numériques usuelles, les jumeaux numériques permettent de travailler à grande échelle, en temps réel (temps de calcul réduit), et peuvent interagir avec le processus étudié. De nombreuses données en temps réel sont mesurées à l'échelle de la station d'épuration de Seine Aval, la plus grande usine d'épuration d'Europe. Ces données ont un fort potentiel de valorisation et permettront de réaliser un jumeau numérique de l'ensemble de la station d'épuration. La première étape d'un tel projet est de déterminer quel modèle est adapté pour le traitement des données hautes-fréquences d'exploitation, d'environnement et de routage de l'usine d'épuration afin de réaliser une prédiction efficace et en temps réel de la qualité des eaux de sortie en prenant en compte l'évolution de la station d'épuration.Cette action sera menée sur les données de la station d'épuration de Seine Aval. Les objectifs à réaliser sont les suivants : La détermination et la récupération des données clés d'exploitation, d'environnement et de routage ; La validation des données de débit et de qualité des eaux en amont de l'usine ; La construction et la calibration d'un modèle d'apprentissage en temps réel, avec construction d'une base de donnée ad hoc, permettant d'intégrer les évolutions de la station au cours du temps et de prédire les données de débit et de qualité des eaux en aval de l'usine d'épuration afin d'évaluer son impact sur le milieu naturel et de le minimiser en optimisant l'exploitation du jumeau numérique de l'usine ; L'intégration des résultats du modèle temps réel à une interface de visualisation.