Détection pan génomique de locus sous sélection en présence de données multi-populationnelles en marquage dense : nouvelles méthodes multipoint et applications aux espèces animales d'élevage

par María Inés Fariello Rico

Thèse de doctorat en Écologie, biodiversité et évolution

Sous la direction de Magali San Cristobal, Simon Boitard et de Hugo Naya.

Soutenue en 2013

à Toulouse 3 en cotutelle avec l'Universidad de la República .


  • Résumé

    Depuis leur domestication, les animaux de ferme ont montré une grande diversification phénotypique. Ils représentent ainsi un modèle pour l'étude de la sélection. De plus, la détection des traces de sélection dans ce type d'espèce peut donner des résultats importants pour l'agronomie, en identifiant des régions du génome associées aux caractères agronomiques ou à la résistance aux maladies. Des données donnant accès à l'information génotypique de populations permettent d'effectuer des études de détection de traces de sélection pan génomiques. Dans ce contexte, les tests de détection de sélection existants doivent relever deux nouveaux défis : avec le nombre croissant de marqueurs typés, la corrélation entre eux augmente, ce qui doit être pris en compte. D'autre part, les tests utilisés se basent sur la comparaison de deux populations. Considérer plus de deux populations devrait permettre d'augmenter la puissance de détection, mais nécessite que les corrélations entre les populations générées par leur évolution conjointe soient prises en compte. J'ai proposé deux tests statistiques pour détecter la sélection en utilisant des données génétiques denses collectées dans plusieurs populations. Le premier est basé sur la différentiation haplotypique entre populations et utilise des données individuelles. Le deuxième cumule des signaux de tests simple marqueur en utilisant la théorie du score local et ne nécessite que des données populationnelles. Par simulations et application à des données réelles, j'ai montré que la puissance de détection augmente par rapport à d'autres tests. L'analyse de jeux de données chez le mouton et la caille permet de proposer des gènes candidats.

  • Titre traduit

    Detection of positive selection from multi population samples using dense genome wide data : new multipoint methods and application to farm animal species


  • Résumé

    Since initial domestication by Humans, farm animal species have experienced great phenotype diversification and thus represent an interesting model for the study of natural and artificial selection. Besides, the detection of selection signatures in these species can have substantial agronomic outcomes, pointing out genomic regions related to production traits or resistance to diseases. Many datasets giving access to genome wide genotypic information have become available enabling to scan entire genomes for signatures of selection. Many tests designed to detect positive selection are challenged by at least one of the following problems. First, as the number of available markers increases, so do their correlations which need to be taken into account. Second, many tests have been designed to compare populations only pairwise. Considering more than two populations simultaneously should increase the power to detect selected regions, but necessitates to account for correlations between them arising from their shared history. I proposed two statistical tests for the detection of positive selection signatures using dense genetic data collected from multiple populations. One is based on haplotypic differentiation between populations, requiring genetic data at the individual level. The second one consists in cumulating single marker signals using local score theory, requiring data at the population level. Through simulated and real datasets, I showed that these tests increased the detection power compared to other existing tests in many cases. Applied to two data sets in sheep and quail, they also point out biologically relevant candidate genes under selection.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (232 p.)
  • Annexes : Bibliogr. p. 219-229.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Disponible pour le PEB
  • Cote : 2013 TOU3 0169

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2013TOU30169
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.