Thèse soutenue

Approche computationnelle pour le repositionnement de médicament au travers d’une perspective holistique avec les graphes de connaissances (OREGANO)

FR  |  
EN
Auteur / Autrice : Marina Boudin
Direction : Gayo DialloFleur Mougin
Type : Thèse de doctorat
Discipline(s) : Santé publique Option Informatique et Santé
Date : Soutenance le 10/02/2025
Etablissement(s) : Bordeaux
Ecole(s) doctorale(s) : Sociétés, Politique, Santé Publique
Partenaire(s) de recherche : Laboratoire : Bordeaux population Health
Jury : Président / Présidente : Patricia Thébault
Examinateurs / Examinatrices : Richard Chbeir
Rapporteurs / Rapporteuses : Adrien Coulet, Lina Fatima Soualmia

Résumé

FR  |  
EN

La découverte de médicaments est un processus long et coûteux. Le repositionnement de médicaments est une alternative prometteuse qui consiste à trouver de nouvelles indications pour des médicaments existants. En comparant de grandes quantités d’informations sur les médicaments qui ont échoué aux dernières phases des essais cliniques ou qui ont obtenu une autorisation de mise sur le marché, et donc commercialisés, il est possible de trouver des médicaments candidats au repositionnement capables de traiter une affection pour laquelle ils n’ont pas été développés initialement. Pour comparer tous ces médicaments, les méthodes computationnelles s’appuyant sur de grandes bases de données sont privilégiées pour leur efficacité, leur rapidité et leur capacité à croiser de grandes quantités d’informations. Les graphes de connaissances sont des structures appropriées pour intégrer ces informations de nature hétérogène. Un graphe de connaissances organise ces informations en triplets composés d’un sujet, d’un objet et d’un prédicat explicitant la relation entre le sujet et l’objet. Ce graphe, combiné à des techniques de plongement de nœuds (apprentissage automatique), permet de prédire de nouvelles relations entre sujets et objets (qui sont des nœuds du graphe). Il est donc possible de transformer le problème de repositionnement en un problème de découverte de nouveaux liens dans un graphe. Cette thèse s’intéresse à ces problématiques dans le cadre du projet OREGANO visant à construire un large graphe de connaissances sur les médicaments et à appliquer des techniques de plongement de nœuds pour le repositionnement de médicaments. Ces techniques ''projettent'' le graphe dans un espace vectoriel où chaque entité est représentée par un vecteur. Une des innovations apportées par OREGANO est également d’inclure des données sur des composés naturels dont les propriétés médicinales sont exploitées dans de nombreux pays et dont les potentialités de repositionnement ont été peu explorées. Dans un premier temps, nous présentons la manière dont nous avons conçu le graphe de connaissances OREGANO, en considérant deux approches d’intégration distinctes. Nous exposons ensuite les évolutions qui ont été apportées au graphe au fil des versions. Dans un troisième temps, nous exposons la capacité du graphe de connaissances OREGANO à prédire de nouveaux liens grâce à des techniques de plongement de nœuds. Les prédictions sont évaluées avec les métriques habituelles et empiriquement dans le cadre du repositionnement de médicaments. Le graphe OREGANO ainsi que les développements des algorithmes et du code sont disponibles pour la communauté scientifique à l’adresse suivante : https://gitub.u-bordeaux.fr/erias/oregano.