Thèse soutenue

Développement d'une infrastructure d'analyse multi-niveaux pour la découverte des relations entre génotype et phénotype dans les maladies génétiques humaines
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Tien Dao Luu
Direction : Olivier Poch
Type : Thèse de doctorat
Discipline(s) : Bioinformatique
Date : Soutenance le 24/10/2012
Etablissement(s) : Strasbourg
Ecole(s) doctorale(s) : École doctorale Sciences de la vie et de la santé (Strasbourg ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Institut de génétique et de biologie moléculaire et cellulaire (Strasbourg)
Jury : Président / Présidente : Gilbert Deleage
Examinateurs / Examinatrices : Jean-Daniel Zucker, Nicolas Lachiche
Rapporteurs / Rapporteuses : Marie-Dominique Devignes

Résumé

FR  |  
EN

Répondant au besoin de mieux comprendre les relations qui lient un génotype aux phénotypes moléculaires et cliniques associés, nous avons développé une nouvelle infrastructure bioinformatique qui unit, dans un même système, la collecte, la gestion, la maintenance et le traitement de multiples données ou informations. La première contribution de cette thèse est SM2PH Central et sa capacité de générer des instances. SM2PH Central constitue notre centre de référence en ligne pour toutes les protéines humaines intégrant des niveaux d’informations qui vont des aspects génomiques, structuraux, fonctionnels ou évolutifs aux aspects de transcriptomique, interactomique, protéomique ou métabolomique. La deuxième contribution est MSV3d, une ressource d’annotation multi-niveau (propriétés physico-chimiques, fonction, évolution, structure) des mutations humaines connues. MSV3d fournit l’ensemble des connaissances exploitées par la troisième contribution de cette thèse à savoir KD4v, notre base d’extraction de connaissances pour prédire l’impact phénotypique d’une mutation. La base de connaissances de KD4v induite par la Programmation Logique Inductive contient des règles exploitables par un humain ou un ordinateur et des facteurs prédictifs caractérisant les mutations neutres ou délétères. Enfin, l’ultime contribution de cette thèse est liée au développement de GEPeTTO, un prototype de priorisation de gènes. Une application biologique a été réalisée. Nous avons étudié la cécité nocturne en utilisant SM2PH Central, en combinaison avec le service d’annotation de MSV3d et la méthode de prédiction KD4v pour analyser le gène GPR179 et ses deux mutations nouvellement identifiées.