Développement et utilisation de nouveaux descripteurs moléculaires à des fins de criblage virtuel en chémogénomique
Auteur / Autrice : | Nathanael Weill |
Direction : | Didier Rognan |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences Chimiques. Chémogénomique |
Date : | Soutenance en 2009 |
Etablissement(s) : | Strasbourg |
Mots clés
Mots clés contrôlés
Résumé
Depuis des décennies, l’utilisation de petites molécules comme outils d’investigation dans la compréhension des mécanismes cellulaires a été employée. En effet, ces molécules permettent de moduler l’action d’une protéine en se fixant à son site actif. Ainsi, ces modulateurs permettent d’évaluer la fonction de cette protéine et de l’intégrer dans un contexte plus large que représente la cellule ou l’organisme. Le cas échéant, ces molécules peuvent même être employées à des fins thérapeutiques. Plusieurs problèmes se posent lors de la conception de nouveaux modulateurs. Le premier réside dans la difficulté de les identifier. Le deuxième est qu’il est difficile d’évaluer si un modulateur agit également sur une autre protéine. Pour répondre à ces deux problèmes, une approche chémogénomique peut être employée. Afin de mieux comprendre le procédé employé, considérons le problème sous la forme d’une matrice. Chaque colonne de cette matrice représente une protéine et chaque ligne une molécule. Les cases sont remplies par les informations disponibles sur le complexe potentiellement formé entre la protéine et le ligand considéré. Ces informations peuvent être des constantes d’affinités (Ki, IC50…) ou des mesures fonctionnelles (EC50, gène rapporteurs…). Le plus souvent aucune information n’est disponible sur le complexe, la case est alors vide. Afin de remplir ces cases, deux approches basées sur des principes différents sont couramment utilisées. Des molécules similaires peuvent se lier à un même site actif de protéine. Ainsi, de proche en proche il est possible de remplir la matrice par colonne. Cette approche se trouve cependant limitée aux protéines dont des ligands sont connues. Dans le cas contraire (récepteurs orphelins par exemple), cette approche n’est pas envisageable. Des sites de liaison similaires peuvent fixer le même ligand. Ici, on s’attache à remplir la matrice par ligne. Cette approche permet à la fois de trouver de nouveaux ligands pour une protéine donnée ainsi que d’établir un profil de sélectivité pour un ligand. Comme précédemment, cette approche connait une limite. En effet, Il n’est pas possible d’explorer une ligne vide de la matrice (un ligand n’ayant jamais été testé sur aucune protéine). Pour dépasser ces limitations, l’approche chémogénomique se propose de considérer globalement l’ensemble des cases renseignées de la matrice pour remplir les cases vides. Cette approche se base alors sur le principe suivant : Des sites de liaison de protéines similaires peuvent lier des ligands similaires. L’avantage de cette méthode est qu’il est à présent possible de se déplacer dans la matrice de façon oblique et renseigner beaucoup plus de cases. Dans la première partie de cette thèse, nous nous sommes d’abord intéressés aux différentes méthodes chémogénomiques envisagées à ce jour. Cette approche étant récente, elle n’est apparue qu’après l’achèvement du séquençage complet du génome humain (ère post-génomique). Une rapide recherche bibliographique permet de voir que le premier article paru citant le mot « chémogénomique » ne date que de 2001. Toutefois, des progrès considérables ont été réalisés depuis cette date et il est possible à présent de catégoriser cette approche de la manière suivante : 1. Approche chémogénomique basée sur les ligands. Par exemple, cette approche permet de classifier les protéines selon le chémotype de leurs ligands. 2. Approche chémogénomique basée sur les protéines. Cette approche se base sur l’information disponible sur une protéine donnée (séquence, structure…). Il s’agit ici de faire rejaillir des similitudes entre protéines et d’extrapoler cette information aux ligands. 3. Approche chémogénomique basées sur les complexes protéine-ligand. Cette approche ne considère plus le ligand ou la protéine comme deux entités séparées mais comme membres d’un ensemble que constitue le complexe. Dans la deuxième partie de cette thèse sera exposée l’élaboration et la validation d’une nouvelle approche chémogénomique basée sur les complexes protéine-ligand. Cette étude s’est focalisée sur les récepteurs aux protéines G (RCPG) non-olfactifs qui sont au nombre de 366. Les RCPG sont des protéines transmembranaires responsables de la transduction du signal depuis l’extérieur vers l’intérieur de la cellule. En effet, la fixation d’une molécule agoniste sur la protéine du coté extra cellulaire entraine un changement conformationnel qui induit une cascade de réactions du coté intracellulaire. De plus, de part son rôle, cette famille de protéines constitue une des plus importantes familles de cibles d’intérêt thérapeutique. Des modèles statistiques sont crées à partir de vecteurs représentant l’information moléculaire et protéique. Ces modèles sont alors capable de prédire pour une molécule donnée, les cibles potentielles, et pour un récepteur donné les ligands potentiels. Dans la troisième partie de cette thèse nous avons utilisé les modèles précédemment validés dans le cadre d’un criblage prospectif. Il s’agit de trouver de nouvelles molécules agonistes non peptidiques sélectives du récepteur de l’ocytocine. Ce récepteur est impliqué dans divers processus physiologiques chez la femme enceinte (déclenchement des contractions et de la lactation) mais il intervient plus généralement dans les rapports sociaux entres individus (attachement, fidélité) et semble être aussi impliqué dans l’autisme. Quatre méthodes différentes de criblage virtuel ont été employées pour optimiser les chances d’obtenir des touches. Cette partie développe en détaille les méthodes employées ainsi que les problématiques rencontré lors d’une campagne de criblage virtuel. Dans la quatrième partie de cette thèse nous sous sommes attachés à développer de nouveaux descripteurs génériques de site actifs de protéines. Ces descripteurs pourront être employés afin de généraliser le concept de descripteur protéine-ligand à toute protéine de structure tridimensionnelle connue, quelle que soit la famille à laquelle elle appartient (récepteur membranaire, canal, enzyme, récepteur nucléaire). Basés sur la structure des sites actifs, ces descripteurs permettent de représenter sous formes de vecteurs les sites de liaison d’une protéine indépendamment de leur orientation dans l’espace. Ces vecteurs représentent les triangles formés à partir des carbones α du site actif, où chaque nœud représente des propriétés pharmacophoriques. Ces descripteurs pourront soit permettre d’établir une similarité entre les sites actifs de protéines (2ème approche chémogénomique) soit être intégrés dans une représentation de complexe protéine-ligand (3ème approche chémogénomique) à plus vaste échelle que celle précédemment décrite pour l’espace biologique des RCPG.