Thèse soutenue

Deep Learning pour l’identification de différences phénotypiques visuelles subtiles entre lignées neuronales, modèles de la maladie de Parkinson

FR  |  
EN
Auteur / Autrice : Tiphaine Champetier
Direction : Auguste Genovesio
Type : Thèse de doctorat
Discipline(s) : Biologie computationnelle
Date : Soutenance le 27/05/2020
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Complexité du vivant (Paris)
Partenaire(s) de recherche : Laboratoire : Institut de biologie de l'École normale supérieure (Paris ; 2010-....)
établissement de préparation de la thèse : École normale supérieure (Paris ; 1985-....)
Jury : Président / Présidente : Patrick Bouthémy
Examinateurs / Examinatrices : Auguste Genovesio, Patrick Bouthémy, Matthias Groszer, Priscille Brodin, Elsa D. Angelini, Gaëlle Boncompain
Rapporteurs / Rapporteuses : Patrick Bouthémy, Matthias Groszer

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Le criblage à haut contenu connaît un essor important depuis le milieu des années 2000. Cette technologie est d’un intérêt primordial pour l’industrie pharmaceutique car elle permet en principe la découverte de molécules à visée thérapeutique pour des maladies dont les voies moléculaires sont mal identifiées. Jusqu’à présent un phénotype cellulaire mesurable doit au préalable être identifié afin d'évaluer l’effet d’une banque de composés sur celui-ci. Du point de vue de l’analyse d’image, les cellules traitées sont détectée automatiquement sur des centaines de milliers d’images et des mesures de descripteurs permettent de différencier finement les traitements effectifs par rapport à un contrôle négatif. En collaboration avec les entreprises Ksilink et Sanofi, nous avons été confrontés à un nouveau type de crible à haut contenu pour identifier des composés efficaces contre la maladie de Parkinson. Celui-ci, présentant des images de neurones, rendait caduque l’analyse dépendant d’une segmentation robuste des cellules. Par ailleurs, grâce à des techniques de différentiation cellulaire et d’édition de génome, les contrôles du modèle cellulaire sont deux cultures de neurones, isogéniques à une mutation près : la mutation GS2019 induisant la maladie. Néanmoins, l’hétérogénéité propre à ces cellules de forme complexe, et les différences fines entre les deux lignées isogéniques ne permettent pas à l’œil humain l’identification de deux phénotypes distincts. Dans le but de permettre la mise en évidence automatique des différences entre phénotypes, nous avons proposé d’employer des approches de deep learning. Ce travail s’est décomposé principalement en deux étapes. La première étape a consisté à identifier une architecture de réseau capable de classifier des images de neurones. Nous avons appris que les cultures de neurones montraient des différences de phénotype de manière très hétérogène et donc pas systématique. La deuxième étape a consisté à proposer des méthodes pour expliquer et interpréter les différences subtiles de phénotype, ceci afin de s’assurer que le crible soit effectué sur la base d’une différence avérée entre phénotypes et non sur la base d’un biais technique. Partant du principe que les différences entre phénotypes neuronaux sont difficiles à appréhender visuellement entre deux images différentes du à la grande variabilité naturelle des neurones, nous proposons l’idée que la transformation d’une même image d’un phénotype à un autre peut représenter une approche intéressante. En effet, nous montrons qu'il est possible d'entraîner des réseaux antagonistes à transformer une image de neurone non porteur de la mutation en neurone porteur et inversement. De cette façon, nous avons pu mettre en évidence des potentiels biais de l’assay mais également ce que nous pensons être de véritables différences morphologiques liés à la mutation pathologique auparavant invisibles.