Étude de la composante génétique de la variabilité des infections palustres simples : Approche génome entier dans deux cohortes de jeunes enfants au Bénin

by Jacqueline Milet

Doctoral thesis in Santé publique - génétique statistique

Under the supervision of Hervé Perdry.

  • Alternative Title

    Study of the Genetic Component of Uncomplicated Malaria Infections : Genome-Wide Approach in Two Birth-Cohorts in Benin


  • Abstract

    In spite of numerous prevention and control efforts in recent years, malaria remains a major global public health problem with nearly half a million deaths per year (405,000 in 2018). The key role played by genetic factors of the host in the susceptibility and severity of the disease is is admitted nowadays. However, the molecular basis of susceptibility / resistance to malaria has not been elucidated to date. Over the past decade, research efforts to identify genes involved in malaria susceptibility have focused on severe malaria, with several genome-wide association studies (GWAS) published. This manuscript concerns the extension of this approach to uncomplicated forms of malaria, through the genome wide association study of two birth cohorts in South Benin (800 children), followed for 18-24 months by UMR261 (MERIT IRD / University of Paris).In the first part, we present the results of the first GWAS performed on simple forms of malaria in these two cohorts. The association was tested with the recurrence of malaria attacks and the recurrence of all infections (including malaria attacks and asymptomatic infections) taking into account an environmental risk estimated at the individual level. It highlights several strong association signals, linked to genes whose biological function is relevant for malaria (in particular PTPRT, MYLK4, UROC1 and ACER3). The high genetic diversity within African populations has made it necessary to take into account the potential confounding effect of population structure. In this study we proceeded with a two-step strategy as the Cox mixed model, used for the analysis of longitudinal data, is not applicable to the whole genome due to computational burden. In a first step, an analysis was performed with a Cox mixed model to build an "individual effect" fitted on the covariates, then a linear mixed model were used to test the association with genome polymorphisms. This led us to focus more generally on non-linear mixed models. Two methods allowing the estimation of the effect of polymorphisms with the mixed logistic model are proposed, which may in the future be generalized to other models, including the Cox model.In a final part, malaria having been one of the strongest selection pressures that man has known in recent history, we explore the possibility of exploiting natural selection information to increase the power of analysis, and improve the detection of association signals. The analysis of recent positive selection signals were performed using several genome-scan methods focusing on patterns of long-range haplotype homozygosity (iHS, nsL and XP-EHH). This analysis revealed several chromosomic region of potential interest, where the signals of association and selection co-localized but confirms also the difficulty of highlighting the selection signals linked to malaria with tools currently available.


  • Abstract

    Malgré les moyens importants de prévention et de lutte mis en place ces dernières années, le paludisme reste dévastateur avec près d’un demi-million de décès par an (405 000 en 2018, d'après le dernier rapport de l'OMS). Le rôle clé joué par les facteurs génétiques de l’hôte dans la susceptibilité et la sévérité de la maladie est admis aujourd'hui. Cependant, les bases moléculaires de la sensibilité/résistance au paludisme restent encore mal connues. Ces dix dernières années, les efforts de recherches pour l’identification de gènes impliqués dans la sensibilité au paludisme à P. falciparum se sont concentrés sur les formes graves de paludisme, avec plusieurs plusieurs études d’association sur l’ensemble du génome (Genome-Wide Association Study ou GWAS) publiées. Ce manuscrit porte sur l’extension de cette approche aux formes simples du paludisme, au travers de l’étude d’association génome entier de deux cohortes de nouveau-nés au Sud Bénin (au total 800 enfants), suivis pendant 18-24 mois par l’UMR261 (MERIT IRD/Université de Paris). Dans une première partie nous présentons les résultats de la première GWAS réalisée sur les formes simples de paludisme dans ces deux cohortes. L’association a été testée avec la récurrence des accès palustres et la récurrence de l’ensemble des infections (incluant les accès palustres et les infections asymptomatiques) en prenant en compte un risque environnemental estimé au niveau individuel. Elle met en évidence plusieurs signaux d’association forts, en lien avec des gènes dont la fonction biologique est pertinente pour le paludisme (notamment PTPRT, MYLK4, UROC1 et ACER3). La forte variabilité génétique présente au sein des populations africaines a nécessité de prendre en compte l’effet de confusion potentiel de la structure de population. Dans l’étude les formes simples de paludisme, une approche en deux étapes a été utilisée, le modèle de Cox mixte, utilisé pour l’analyse des données longitudinales, n’étant pas applicable à l’ensemble du génome du fait du temps de calcul nécessaire. Un modèle de Cox mixte a été appliqué pour construire un « effet individuel » ajusté sur les covariables, puis un modèle mixte linéaire pour tester l’association avec les polymorphismes du génome. Ceci nous a conduits à nous intéresser plus généralement aux modèles mixtes non-linéaires. Deux méthodes permettant l’estimation de l’effet des polymorphismes avec le modèle logistique mixte sont proposées, qui pourront être dans le futur généralisé à d’autres modèles, dont le modèle de Cox. Dans une dernière partie, le paludisme ayant constitué une des plus fortes pressions de sélection que l’homme ait connue dans son histoire récente, nous explorons la possibilité d’exploiter l’information de sélection naturelle pour augmenter la puissance de l’analyse, et améliorer la détection des signaux d’association. L’analyse des signaux de sélection positive récente sur l’ensemble du génome a été réalisée avec plusieurs méthodes basées sur les haplotypes longs ((iHS, nsL and XP-EHH). Celle-ci met en évidence plusieurs régions chromosomiques d’intérêt potentiel où les signaux d’association et de sélection co-localisent ; mais confirme également la difficulté à mettre en évidence les signaux de sélection liés au paludisme avec les outils disponibles actuellement.


It's available in the institution of thesis defence.

Consult library

Version is available

Where is this thesis?

  • Library : Université Paris-Saclay. DiBISO. Bibliothèque électronique.
See the Sudoc catalog libraries of higher education and research.