Thèse soutenue

Méthode d'apprentissage profond pour l'analyse génomique des cancers canins comme modèle des cancers humains
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Camille Kergal
Direction : Christophe HitteThomas Derrien
Type : Thèse de doctorat
Discipline(s) : Génétique, génomique, bioinformatique
Date : Soutenance le 18/10/2022
Etablissement(s) : Rennes 1
Ecole(s) doctorale(s) : École doctorale Biologie-Santé (Nantes)
Partenaire(s) de recherche : Laboratoire : Institut de Génétique et Développement de Rennes (UMR 6290)
Jury : Président / Présidente : Hugues Roest Crollius
Examinateurs / Examinatrices : Christophe Antoniewski, Marie-Dominique Galibert, Anna-Sophie Fiston-Lavier, Andrea Rau
Rapporteurs / Rapporteuses : Hugues Roest Crollius, Anita Burgun

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Les méthodes d’apprentissage profond (DL) se sont récemment révélées être de puissantes stratégies pour prédire l’activité régulatrice d’une séquence génomique et donc pour, in fine, évaluer l’impact des mutations régulatrices sur l’expression des gènes. L’outil Basenji propose une approche DL utilisant des réseaux de neurones convolutifs pour prédire le niveau d’expression de gènes humains. Nous avons adapté ce programme pour entraîner un modèle d’expression génique spécifique au chien et montré que ce modèle de prédiction atteignait des performances similaires à celles observées chez l’homme, avec des corrélations élevées entre les niveaux d’expression réels et ceux pré- dits (r=0,66). Pour prédire le niveau d’expression de gènes canins, nous démontrons également que l’utilisation du modèle de prédiction canin (approche intra-espèce) aboutit à de meilleures performances que le modèle humain (approche inter-espèce), notamment en lien avec certaines caractéristiques spécifiques aux séquences canines (niveau de GC, d’éléments transposable et conservation évolutive). Le chien étant un modèle naturel pour l’étude des cancers humains, nous avons également exploité ces modèles pour prédire l’impact de mutations non-codantes sur l’expression de gènes impliqués dans les cancers. Nous avons ainsi localisé 1301 mutations communes entre l’homme et le chien, suggérant un rôle fonctionnel dans la régulation de l’expression de gènes impliqués dans les cancers. Finalement, nos modèles et les outils pour les exploiter sont disponibles sur GitHub : https://github.com/ckergal/BLIMP.