Thèse soutenue

Vision par ordinateur pour l'analyse des motifs de localisation intracellulaire de l'ARN

FR  |  
EN
Auteur / Autrice : Arthur Imbert-Meissirel
Direction : Thomas Edgar Walter
Type : Thèse de doctorat
Discipline(s) : Bio-informatique
Date : Soutenance le 15/12/2022
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique
Partenaire(s) de recherche : Laboratoire : Centre de bio-informatique (Fontainebleau, Seine et Marne)
établissement de préparation de la thèse : École nationale supérieure des mines (Paris ; 1783-....)
Jury : Président / Présidente : Etienne Decencière
Examinateurs / Examinatrices : Thomas Edgar Walter, Perrine Paul-Gilloteaux, Florian Mueller
Rapporteurs / Rapporteuses : Carolina Wählby, Marcelo Nollmann

Résumé

FR  |  
EN

Tous les ARNs ne se sont pas uniformément distribués dans la cellule. Pour certains gènes, une distribution asymétrique et localisée des transcripts peut être observée. Ce phénomène participe à la régulation de l'expression génétique. Actuellement, pour étudier la localisation intracellulaire des ARNs, une méthode appropriée est single molecule FISH (smFISH). Les molécules d'ARN sont ciblées avec des marqueurs fluorescents et peuvent ainsi être observées au microscope. Cette technique, et ses variantes, permet d'étudier des milliers de transcripts à l'échelle de la cellule. Toutefois, les outils informatiques utilisées pour ces expériences présentent des limites. Lors d'une expérience avec des images de smFISH, une analyse complète nécessite souvent d'intégrer des outils différents, de les calibrer et de développer du code propre à l'étude. Cela pénalise le passage à l'échelle sur des études avec un grand volume de données, ainsi que leur reproductibilité. Avec cette thèse, je présente une nouvelle version de FISH-quant, un outil destiné à l'analyse des images de smFISH. Les actions les plus communes et nécessaires pour traiter les images d'ARNs y sont disponibles et améliorées : la détection des ARNs, la segmentation des cellules et des noyaux, ainsi qu'une sélection d'indicateurs statistiques, le tout réuni dans un seul outil. En outre, nous avons étudié la possibilité d'entraîner un modèle d'apprentissage à partir de nuages d'ARNs simulés, afin de pouvoir classifier différents schéma de localisation. Enfin, nous avons utilisé FISH-quant dans différentes études avec des données réelles. Ces expériences ont permis d'étudier plusieurs dizaines de gènes à travers plus de 100000 cellules identifiées. Nous avons d'abord développé un modèle de classification pour reconnaître les schémas de localisation d'ARN les plus fréquents. Ensuite, nous nous sommes intéressés à quantifier et décrire statistiquement différents types de localisation autour du centrosome ou dans les extensions périphériques de la cellule. Nous avons notamment caractérisé des schémas de localisation liés à la traduction des protéines ou au cycle cellulaire.