Apprentissage des structures cachées dans la dynamique stochastique des systèmes vivants
Auteur / Autrice : | João Pedro Valeriano miranda |
Direction : | Pierre Ronceray |
Type : | Projet de thèse |
Discipline(s) : | PHYSIQUE & SCIENCES DE LA MATIERE - Spécialité : BIOPHYSIQUE |
Date : | Inscription en doctorat le 01/10/2023 |
Etablissement(s) : | Aix-Marseille |
Ecole(s) doctorale(s) : | Ecole Doctorale Physique et Sciences de la Matière |
Partenaire(s) de recherche : | Laboratoire : CINaM - Centre Interdisciplinaire de Nanoscience de Marseille |
Mots clés
Mots clés libres
Résumé
Les progrès de la technologie de la microscopie ont entraîné une explosion de la production de données sur la dynamique de différents systèmes biologiques, des protéines aux micro-organismes entiers. Cependant, ces données sont toujours imparfaites en raison de multiples limitations expérimentales, ce qui fait de l'inférence des modèles sous-jacents une tâche redoutable. Nous avons tout intérêt à compenser ces limites de la collecte de données en optimisant les méthodes d'inférence utilisées pour traiter ces données. Par exemple, certaines avancées ont permis d'améliorer de manière significative l'inférence à partir de données corrompues par le bruit de mesure [1]. Dans ce projet, nous nous attaquerons au problème de l'incomplétude des données expérimentales. Dans le cas de systèmes biologiques complexes, il n'est jamais possible de mesurer tous les degrés de liberté pertinents pour la dynamique observée. Par conséquent, lorsqu'on propose un modèle pour la dynamique observée, il faut être conscient que la dynamique des quantités mesurées dépend également de variables cachées non mesurées. Pourtant, les méthodes d'inférence actuelles ignorent souvent l'existence de ces variables cachées. Nous développerons des méthodes d'inférence de pointe pour prendre en compte les variables cachées non mesurées qui peuvent affecter la dynamique des quantités observées. En utilisant la théorie de l'information, nous développerons des outils pour estimer la quantité d'informations sur les variables cachées disponibles à travers les variables mesurées. Si les données disponibles contiennent suffisamment d'informations, nos améliorations permettront aux chercheurs de découvrir la structure cachée des processus biologiques, améliorant ainsi leur compréhension. En l'absence d'informations suffisantes pour révéler cette structure sous-jacente, nous parviendrons au moins à estimer les corrélations temporelles dans les quantités observées induites par la dynamique des variables cachées, ce qui permettra d'améliorer les prédictions pour ces systèmes. [1] Frishman, A. & Ronceray, P. Learning Force Fields from Stochastic Trajectories. Phys. Rev. X 10, 021009 (2020).