Thèse soutenue

Outils de biologie computationnelle pour l'étude des protéines de liaison à l'ARN à l'échelle du transcriptome
FR  |  
EN
Accès à la thèse
Auteur / Autrice : J. Antonio Paternina Osorio
Direction : Hervé Le HirAuguste Genovesio
Type : Thèse de doctorat
Discipline(s) : Biologie computationnelle
Date : Soutenance le 06/10/2020
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Complexité du vivant (Paris)
Partenaire(s) de recherche : Laboratoire : Institut de biologie de l'École normale supérieure (Paris ; 2010-....)
établissement de préparation de la thèse : École normale supérieure (Paris ; 1985-....)
Jury : Président / Présidente : Antonin Morillon
Examinateurs / Examinatrices : Hervé Le Hir, Auguste Genovesio, Antonin Morillon, Mihaela Zavolan, Pierre Nicolas, Silvia Bottini
Rapporteurs / Rapporteuses : Mihaela Zavolan, Pierre Nicolas

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La régulation post-transcriptionnelle de l’expression des gènes est un réseau d’interactions impliquant de nombreuses protéines de liaison à l’ARN et des ARN non-codants afin d’orchestrer la vie complexe des ARN messagers (ARNm). Chez les métazoaires, le complexe EJC (Exon Junction Complex) est un complexe multiprotéique déposé sur la jonction exonique des ARNm pendant l’épissage. L’EJC interagit avec de nombreux facteurs et est important pour le couplage fonctionnel entre l’épissage et l’export du noyau, la localisation, la traduction et la dégradation des ARNm. Malgré son rôle central dans la régulation génique et le développement de l’organisme, aucune carte exhaustive des sites de liaison de l’EJC n’a encore été établie. La méthode de CLIP (Cross-Linking and Immunoprécipitation) associée au séquençage à haut-débit (CLIP-seq) permet d’identifier les sites de liaison protéine à l’ARN in vivo. Cependant, les analyses des données de CLIP-seq ont permettent aujourd’hui d’obtenir une vue globale plutôt qu’une caract érisation individuelle des sites de liaison d’une protéine. En effet, les détecteurs de pics conventionnels appliqués aux données de CLIP de l’EJC produisent des résultats dont la reproductibilité et la sensibilité sont limitées. Durant ma thèse, nous avons développé une stratégie dédiée à la détection du signal de l’EJC au niveau exonique. En agrégeant les informations de différents réplicas, nous avons généré une liste de gènes reproductibles. Au sein de ces gènes, nous avons trouvé une forte corr élation entre la robustesse de détection des exons et le contenu en thymidine (T) au niveau des sites de liaison. Posant l’hypothèse que ceci est un effet du photopontage, nous avons corrigé le score de robustesse par le contenu en T et avons ainsi clairement montré que l’EJC est déposé sur certains exons et pas sur d’autres. Par conséquent, le complexe EJC est déposé de manière diff érentielle le long d’un mˆeme transcrit. Nous avons ainsiétabli une carte des sites de liaisons de l’EJC sans précédent. L’intégration de données supplémentaires a montré que le dépôt de l’EJC est indépendant de l’abondance du transcrit et n’est pas expliqué par des annotations fonctionnelles connues du gène. Bien que ce travail n’a pas permis à ce stade d’identifier les raisons de ce dépôt différentiel, nous présentons une première méthode d’analyse spécifique et reproductible des exons liés à un EJC par CLIP-seq. Les deux contributions principales de ce travail sont donc les suivantes. Premièrement, nous proposons une méthode robuste pour détecter l’enrichissement du signal de l’EJC à l’échelle de l’exon, en démontrant quantitativement que celleci est plus reproductible et plus sensible que les solutions offertes par les outils actuels. Deuxièmement, nous prouvons que, au sein d’un mˆeme transcrit, l’EJC peut être présent sur des exons, et absent d’autres, suggérant que le dépôt de l’EJC est un processus régulé suivant un code qui reste à découvrir.