Computer vision for the analysis of intra-cellular RNA localization patterns - PASTEL - Thèses en ligne de ParisTech Accéder directement au contenu
Thèse Année : 2022

Computer vision for the analysis of intra-cellular RNA localization patterns

Vision par ordinateur pour l'analyse des motifs de localisation intracellulaire de l'ARN

Arthur Imbert-Meissirel
  • Fonction : Auteur
  • PersonId : 1254453
  • IdRef : 269722270

Résumé

RNAs do not necessarily have a random distribution in the cell. Specific localization patterns have been observed and such asymmetric distributions are of functional importance for the spatial regulation of gene expression. Current methods to study intra-cellular RNA localization use single molecule FISH (smFISH) protocols or its multiplexing variants. Each RNA molecule is targeted with fluorescent probes and can be imaged by fluorescence microscopy. These techniques enable single cell level analyses and can be scaled to thousands of transcripts. However, computational methods to quantify RNA localization suffer different flaws, such as the consistency of spot detection between experiments. A complete analysis pipeline typically requires the use of different frameworks and the development of in-house pieces of code, making smFISH analysis difficult to scale and reproduce. In this thesis, I present a new version of FISH-quant, a comprehensive computational framework to process smFISH images. It provides improved modules for the most common operations needed for smFISH analysis such as RNA detection, nucleus and cell segmentation as well as feature engineering, all in the same framework, designed to be flexible and scalable. In addition, I investigate the use of point cloud models directly trained from simulations to address the classification of RNA localization patterns, without the need to compute hand-crafted features. Lastly, I apply FISH-quant to experimental datasets in biological studies that include several dozens of transcripts, analyzed through 100,000 individual cells. For this, I design a classification pipeline to discriminate several generic RNA localization patterns. This allows us to discover translation factories, a new mechanism of spatial control of gene expression. Third, we focus on the centrosomal and protrusion patterns to provide a statistical description of several genes of interest. Altogether, these studies reveal regulation mechanisms more complex than expected with various spatial and temporal dynamics.
Tous les ARNs ne se sont pas uniformément distribués dans la cellule. Pour certains gènes, une distribution asymétrique et localisée des transcripts peut être observée. Ce phénomène participe à la régulation de l'expression génétique. Actuellement, pour étudier la localisation intracellulaire des ARNs, une méthode appropriée est single molecule FISH (smFISH). Les molécules d'ARN sont ciblées avec des marqueurs fluorescents et peuvent ainsi être observées au microscope. Cette technique, et ses variantes, permet d'étudier des milliers de transcripts à l'échelle de la cellule. Toutefois, les outils informatiques utilisées pour ces expériences présentent des limites. Lors d'une expérience avec des images de smFISH, une analyse complète nécessite souvent d'intégrer des outils différents, de les calibrer et de développer du code propre à l'étude. Cela pénalise le passage à l'échelle sur des études avec un grand volume de données, ainsi que leur reproductibilité. Avec cette thèse, je présente une nouvelle version de FISH-quant, un outil destiné à l'analyse des images de smFISH. Les actions les plus communes et nécessaires pour traiter les images d'ARNs y sont disponibles et améliorées : la détection des ARNs, la segmentation des cellules et des noyaux, ainsi qu'une sélection d'indicateurs statistiques, le tout réuni dans un seul outil. En outre, nous avons étudié la possibilité d'entraîner un modèle d'apprentissage à partir de nuages d'ARNs simulés, afin de pouvoir classifier différents schéma de localisation. Enfin, nous avons utilisé FISH-quant dans différentes études avec des données réelles. Ces expériences ont permis d'étudier plusieurs dizaines de gènes à travers plus de 100000 cellules identifiées. Nous avons d'abord développé un modèle de classification pour reconnaître les schémas de localisation d'ARN les plus fréquents. Ensuite, nous nous sommes intéressés à quantifier et décrire statistiquement différents types de localisation autour du centrosome ou dans les extensions périphériques de la cellule. Nous avons notamment caractérisé des schémas de localisation liés à la traduction des protéines ou au cycle cellulaire.
Fichier principal
Vignette du fichier
2022UPSLM079_archivage.pdf (16.08 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04097617 , version 1 (15-05-2023)

Identifiants

  • HAL Id : tel-04097617 , version 1

Citer

Arthur Imbert-Meissirel. Computer vision for the analysis of intra-cellular RNA localization patterns. Bioinformatics [q-bio.QM]. Université Paris sciences et lettres, 2022. English. ⟨NNT : 2022UPSLM079⟩. ⟨tel-04097617⟩
96 Consultations
63 Téléchargements

Partager

Gmail Facebook X LinkedIn More