Thèse soutenue

FR  |  
EN
Auteur / Autrice : Antonin Marchais
Direction : Daniel Gautheret
Type : Thèse de doctorat
Discipline(s) : Sciences biologiques. Gènes, génomes, cellules
Date : Soutenance en 2010
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Les ARN non-codants (ARNnc) forment une classe hétérogène d’éléments transcrits mais non traduits qui participent, par l’intermédiaire de leur structure et/ou leur séquence, à une grande diversité de processus cellulaire selon de multiple modalités. Ces dernières années, un grand nombre d’ARNnc ont été détectés expérimentalement dans les génomes et aujourd’hui les ARNnc sont considérés comme des acteurs majeurs de la biologie des cellules eucaryotes, bactériennes et archaeénnes. Malgré ces récentes avancées, l’étape de détection expérimentale des ARNnc dans les génomes nécessite toujours un investissement important en temps et reste encore rarement suivie d’une caractérisation fonctionnelle des éléments ainsi identifiés. Partant de ces constatations, nous avons développé une méthode de détection in-silico des ARNnc dans les génomes bactériens que nous avons appelée NAPP pour « Nucleic Acid Phylogenetic Profiling ». NAPP est une adaptation du profilage phylogénétique, une méthode utilisée pour prédire la fonction de protéine de fonction inconnue. NAPP analyse la co-occurrence d’éléments codants et non-codants d’un génome de référence dans toutes les espèces bactériennes disponibles. Il construit ainsi des groupes d’éléments d’histoire phylogénétique similaire et donc probablement dépendants les uns des autres, contraints par la nécessité de conserver l’intégrité d’un processus cellulaire. Parmi ces groupes, certains présentent un enrichissement en ARNnc connus, ce qui nous a permis logiquement de faire de NAPP un outil de détection des ARNnc dans les génomes bactériens. En comparaison à d’autres outils bioinformatiques, les performances de notre programme ont été quantifiées et se sont avérées très favorables dans plusieurs espèces modèles. Mais notre validation a été également expérimentale, permettant la découverte de 7 nouveaux ARNnc chez S. Aureus. L’un de ces ARNnc, RsaOG, a particulièrement retenu notre attention. En effet, fortement exprimé et conservé uniquement dans le genre Staphylococcus, RsaOG pourrait présenter une structure en pseudo-noeud encore jamais observée à notre connaissance dans un ARNnc agissant en trans. Après une étape de prédiction de ses cibles putatives, nous recherchons actuellement à les valider expérimentalement et à intégrer RsaOG dans la physiologie des Staphylocoques. Mais la caractéristique la plus intéressante de NAPP est probablement sa capacité intrinsèque à fournir une indication fonctionnelle sur les éléments qu’il classifie. En effet, l’analyse de l’enrichissement en certaines fonctions des groupes d’éléments codants et non-codants peut, dans le meilleur des cas, constituer un indice sur la fonction des éléments de fonction inconnue contenus dans ces groupes. Ce type d’analyse nous a permis, chez B. Subtilis, d’observer qu’un nouvel ARNnc, que nous avons appelé CsfG, se regroupait phylogénétiquement avec quasiment la moitié des gènes impliqués dans la sporulation. Nous avons donc inféré que CsfG était potentiellement lui-même impliqué dans la sporulation et des études expérimentales et in-silico nous ont permis de confirmer l’implication de CsfG dans la sporulation en validant sa régulation par les facteurs Sigma F et G spécifiques de la formation de la préspore.