Thèse soutenue

Développement de stratégies avancées pour l'identification de relations épistatiques dans les études d'associations génotype-phénotype
FR
Accès à la thèse
Auteur / Autrice : Clément Niel
Direction : Christine SinoquetChristian DinaGhislain Rocheleau
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 15/09/2017
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et mathématiques (Nantes)
Partenaire(s) de recherche : COMUE : Université Bretagne Loire (2016-2019)
Laboratoire : Laboratoire des Sciences du Numérique de Nantes
Jury : Président / Présidente : Hesham Ali
Examinateurs / Examinatrices : Jérémie Bourdon, Jean-Daniel Zucker

Mots clés

FR

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

Au cours de la dernière décennie, les technologies génomiques à haut débit ont visél'élucidation des prédispositions génétiques de certaines maladies complexes, tellesque le diabète ou l'arthrite rhumatoïde, le cancer, les maladies cardiaques comme leprolapsus valvulaire mitral et la fibrillation auriculaire, ainsi que pour des centainesd’autres phénotypes. Pour remplir cet objectif, des études d'association du génomeentier ou GWAS (Genome Wide Association Studies) sont conduites. Le principe d'uneGWAS standard est le suivant : les chercheurs utilisent des marqueurs génétiquescouvrant la totalité du génome, et qui correspondent à autant de fenêtresd'observation des variations de l'ADN au sein d'une population. Chaque marqueurgénétique correspond à une localisation précise sur le génome pour laquelle estobservée, pour chaque individu, une variation. Une des classes de marqueur génétiqueles plus populaires, les polymorphismes nucléotidiques simples (ou SNP), ne présenteque deux variations (aussi appelées allèles) en chaque localisation pour tous lesindividus d'une population étudiée. Dans le cadre d'une GWAS, les variations de l'ADNsont observées pour une population de quelques milliers à plusieurs dizaines demilliers d'individus, où chaque individu est décrit par quelques centaines de milliers àplus de deux millions de SNP. Les technologies plus récentes de type séquençage denouvelle génération permettent même de lire toutes les variations du génome d’unindividu. Pour chaque SNP, un test de dépendance ou test d'association avec lamaladie étudiée est réalisé. L'objectif est d'identifier les SNP qui présentent unedifférence de fréquences alléliques statistiquement significative entre la cohorte dessujets malades et celle des sujets non malades. Un tel résultat indique la proximitéphysique sur le génome d’une variation augmentant la susceptibilité d’être atteint dela maladie.