Auteur / Autrice : | Nizar Fawal |
Direction : | Christophe Dunand, Catherine Mathé |
Type : | Thèse de doctorat |
Discipline(s) : | Développement des plantes |
Date : | Soutenance en 2013 |
Etablissement(s) : | Toulouse 3 |
Mots clés
Mots clés contrôlés
Résumé
Une famille de gènes est un groupe de gènes homologues, partageant un ancêtre commun, et ayant des similarités au niveau de leurs séquences et de leurs fonctions. Mon équipe d'accueil, Evolution et Expression des Peroxydases, s'intéresse particulièrement à l'annotation de la superfamille des peroxydases. Les peroxydases sont des enzymes universelles du monde vivant qui catalysent des réactions d'oxydo-réduction impliquant la réduction d'un peroxyde d'hydrogène et l'oxydation d'un substrat, variable d'une classe de peroxydase à une autre. Avec la baisse du coût et du temps nécessaire au séquençage de nouveaux génomes, maintenir une annotation manuelle experte est devenu illusoire. Aussi, pour gérer ce flux croissant de données d'une manière fiable, la première étape était de mettre à jour notre base de données des peroxydases, la PeroxiBase. Dans cette optique, plusieurs outils et pipelines ont été mis en place pour faciliter et accélérer la procédure d'annotation des peroxydases tout en maintenant une haute qualité d'annotations. Tout d'abord, deux pipelines automatiques, '' proteome_filter '' et '' EST_filter '', pour l'annotation des familles multigéniques ont été développés. Ils se basent sur une recherche par homologie à l'aide d'un BLAST dans le but d'identifier les séquences appartenant à la superfamille des peroxydases à partir du protéome ou des données d'ESTs. De plus, GECA, un logiciel pour comparer l'organisation en exon/intron et ainsi détecter les variations de structures de gènes a été développé. Par ailleurs, cette information sur les structures de gènes peut être utilisée aussi pour valider l'annotation des membres des familles multigéniques. Ces outils ont été testés dans le cadre des ligninases. Le choix de cette famille est justifié par l'annotation massive des génomes des champignons en raison de l'intérêt industriel accru pour les ligninases. Ces enzymes appartiennent à la famille des peroxydases de classe II qui se trouve essentiellement chez les champignons où ils sont responsables de la dégradation de la lignine (polymère présent dans la paroi des plantes terrestres). Bénéficiant d'une base de données experte sur les peroxydases, j'ai entrepris des études sur ces enzymes pour les classer et analyser leur évolution. En parallèle, je me suis impliqué dans des projets annexes comme la construction d'un pipeline pour avoir une analyse phylogénétique complète et une étude de l'évolution de huit familles de gènes chez l'Eucalyptus.