Développements de modèles statistiques pour lanalyse de données métabolomiques longitudinales, application aux photogranules
| Auteur / Autrice : | Camille Guilmineau |
| Direction : | Rémi Servien |
| Type : | Projet de thèse |
| Discipline(s) : | Statistiques et Sciences des Données |
| Date : | Inscription en doctorat le Soutenance le 18/09/2025 |
| Etablissement(s) : | Université de Montpellier (2022-....) |
| Ecole(s) doctorale(s) : | École Doctorale Information, Structures, Systèmes |
| Partenaire(s) de recherche : | Laboratoire : LBE - Laboratoire de Biotechnologie de l'Environnement |
| Jury : | Président / Présidente : Nadine Hilgert |
| Examinateurs / Examinatrices : Rémi Servien, Thomas Burger, Guillem Rigaill, Sophie LèBRE, Sophie COLOMBIé, Nathalie Vialaneix, Marie Tremblay-franco | |
| Rapporteurs / Rapporteuses : Thomas Burger, Guillem Rigaill |
Mots clés
Mots clés libres
Résumé
Les photogranules sont des agrégats biologiques composés de divers micro-organismes et dont les capacités épuratoires sont intéressantes pour le traitement des eaux usées. Ce sont des micro-organismes complexes dont le métabolisme et la stabilité peuvent être influencés par l'environnement, ce qui peut altérer leurs performances épuratoires. Ainsi, afin de mieux comprendre le fonctionnement des photogranules et leur évolution au cours du temps, la métabolomique peut être utilisée dans une étude longitudinale. En effet, les métabolites fournissent une image directe de l'activité biochimique d'un organisme. Les métabolites sont impliqués dans des séquences de réactions chimiques appelées voies métaboliques. Ces voies sont associées à des fonctions biologiques, leur analyse fournit donc des informations fonctionnelles sur un organisme, ce qui est d'intérêt dans le contexte des photogranules. Pour répondre à cette problématique, une méthode d'analyse différentielle longitudinale des voies métaboliques a été développée et appelée phoenics. Elle repose sur deux étapes : une réduction de dimension appliquée aux quantifications des métabolites pour obtenir des données par voie métabolique, puis lestimation dun modèle linéaire mixte sur les composantes obtenues. Deux versions sont possibles pour l'étape de réduction de dimension, basées sur l'ACP et la MFA. La MFA étant une méthode d'analyse multi-tables, elle peut être utilisée pour tester n'importe quel effet sauf celui qui correspond aux mesures répétées (le temps dans les analyses longitudinales). Cet effet peut être analysé avec la version ACP de phoenics. Cette étape de réduction de dimension peut conduire à extraire plusieurs composantes principales par voie métabolique, dans ce cas la procédure de Simes est utilisée pour agréger les p-valeurs. Les performances de phoenics ont été évaluées sur des données semi-synthétiques, simulées à partir de données réelles, et comparées à dautres méthodes existantes. Sur des données réelles mesurées dans différents contextes biologiques, la méthode identifie des voies cohérentes. La méthode a été implémentée dans le package R phoenics, disponible sur le CRAN. Dans un second temps, phoenics a été utilisée pour analyser les données recueillies sur les photogranules. Lapproche a permis didentifier des voies dont les métabolites présentent de faibles variations non significatives mais cohérentes, qui n'auraient pas été détectées avec une approche univariée. Ces voies pourraient servir d'indicateurs pour le suivi de lévolution du métabolome des photogranules.