Thèse soutenue

Étude des différentes approches d’indexation du génome au pan-génome : application aux génomes de riz

FR  |  
EN
Auteur / Autrice : Clément Agret
Direction : Manuel RuizAlban MancheronAnnie Chateau
Type : Thèse de doctorat
Discipline(s) : Génétique et amélioration des plantes
Date : Soutenance le 13/10/2020
Etablissement(s) : Montpellier, SupAgro
Ecole(s) doctorale(s) : GAIA (Montpellier ; École Doctorale ; 2015-...)
Partenaire(s) de recherche : Laboratoire : Amélioration Génétique et Adaptation des Plantes/UMR AGAP Montpellier - Laboratoire d'informatique, de robotique et de micro-électronique (Montpellier ; 1992-....)
Jury : Président / Présidente : Thérèse Commes-Maerten
Examinateurs / Examinatrices : Manuel Ruiz, Alban Mancheron, Annie Chateau, Thérèse Commes-Maerten, Jacques Van Helden, Thierry Lecroq, Mikaël Salson, Hélène Chiapello
Rapporteur / Rapporteuse : Jacques Van Helden, Thierry Lecroq

Résumé

FR  |  
EN

Le sujet de ma thèse concerne l’étude des structures d’indexation et les méthodes de compression de données pour palier au problème d’indexation d’une collection de génomes similaires.Le but ultime est d’appliquer ces méthodes à l’indexation des génomes du riz afin de faciliter l’analyse de l’ensemble des études et activités du projet GenomeHarvest. Comme par exemple l’impact de leurs variations structurelles sur les taux de recombinaison, les études des fréquences allèliques, les études GWAS, etc.L’indexation de génomes complets est une étape importante dans l’exploration et la compréhension des données d’organismes vivants. Un index devrait fournir une réponse rapide aux questions suivantes :- Combien de fois un motif donné apparaît dans une collection de génomes ?- Quelles sont les positions et les génomes porteurs d’un motif donné ?- Quelle est la longueur du motif à la position i pour un génome donné ?C’est ce que nous avons réalisé grâce à cette thèse, nous avons réfléchi, proposés un algorithme. Une fois l’algorithme trouvé, nous avons implémenté cet algorithme sous forme d’un logiciel qui permet l’indexation d’une large collection de génome et son requêtage.