Graphes de connaissances et intelligence artificielle explicable : application au repositionnement de médicaments
Auteur / Autrice : | Martin Drancé |
Direction : | Gayo Diallo, Akka Zemmari |
Type : | Thèse de doctorat |
Discipline(s) : | Santé publique - Option Informatique et Santé |
Date : | Soutenance le 04/12/2024 |
Etablissement(s) : | Bordeaux |
Ecole(s) doctorale(s) : | École doctorale Sociétés, politique, santé publique (Talence, Gironde ; 2011-....) |
Partenaire(s) de recherche : | Laboratoire : Bordeaux population Health |
Jury : | Président / Présidente : Antoine Pariente |
Examinateurs / Examinatrices : Adrien Coulet | |
Rapporteurs / Rapporteuses : Zied Bouraoui, Sandra Bringay |
Mots clés
Résumé
Le repositionnement de médicaments consiste à trouver de nouvelles utilisations thérapeutiques pour des médicaments existants qui sont déjà approuvés pour traiter d’autres pathologies. Cette approche profite des connaissances déjà existantes sur ces molécules, permettant ainsi un développement plus rapide et moins coûteux par rapport à la création de nouveaux médicaments. Le repositionnement est particulièrement utile pour répondre à des besoins médicaux non satisfaits, comme par exemple pour les maladies rares ou émergentes. Ces dernières années, le développement de graphes de connaissances a permis de concentrer toutes ces informations biomédicales autour du médicament issues de grandes bases de données ou de connaissances. Un graphe de connaissances est une représentation structurée d’informations provenant de différentes sources, qui relie ces informations les unes aux autres par l’utilisation de relations. Cette représentation est particulièrement utile pour mieux comprendre les relations complexes qui structurent nos connaissances sur un médicament. Elle est utilisée de nos jours pour la tâche de repositionnement en particulier. Une façon efficace de repositionner des médicaments à partir de ces graphes est d’utiliser des méthodes d’intelligence artificielle qui prédisent de nouveaux liens entre les objets du graphe. De cette manière, un modèle correctement entraîné sera capable de proposer une nouvelle connexion entre un médicament et une maladie, indiquant une potentielle opportunité de repositionnement. Cette méthodologie présente cependant un gros désavantage : les modèles pour la prédiction de liens fournissent souvent des résultats opaques, qui ne peuvent pas être interprétés par l’utilisateur final des prédictions. Cette thèse propose d’étudier l’utilisation de méthodes d’intelligence artificielle explicables dans le but de repositionner des médicaments à partir de données biomédicales représentées dans des graphes de connaissances. Dans un premier temps, nous analysons l’impact du pré-entraînement sur les modèles de multihop reasoning pour la prédiction de liens. Nous montrons que la construction des représentations des entités du graphe avant l’entraînement du modèle permet une amélioration des performances prédictives, ainsi que de la quantité et la diversité des explications. Dans un second temps, nous étudions comment l’ajout de relations dans un graphe de connaissances affecte les résultats de prédiction de liens. Nous montrons que l’ajout de liens dans trois graphes biomédicaux permet une amélioration des performances prédictives du modèle SQUIRE, et ce sur différents types de relations lien avec le repositionnement de médicaments. Une analyse de l’impact sur l’explicabilité du modèle est aussi menée à la suite de l’ajout de ces relations. Enfin, nous proposons une nouvelle méthodologie pour la tâche de classification de liens dans un graphe de connaissances, basée sur l’utilisation de forêts aléatoires. À partir des informations concernant le voisinage de chaque noeud dans le graphe, nous montrons qu’un modèle de forêts aléatoires est capable de prédire correctement l’existence ou non d’un lien entre deux noeuds. Ces résultats permettent une visualisation des noeuds utilisés pour réaliser la prédiction. Enfin, nous appliquons cette méthode au repositionnement de médicaments pour la sclérose latérale amyotrophique (SLA).