Construction et validation d'un algorithme d'IA pour la prévention de la chute chez la personne âgée
Auteur / Autrice : | Amadou Maguette Djiogomaye Ndiaye |
Direction : | Achille Tchalla, Laurent Billonnet |
Type : | Projet de thèse |
Discipline(s) : | Biologie Chimie Santé mention Santé publique, épidémiologie, environnement et sociétés |
Date : | Inscription en doctorat le 07/10/2022 |
Etablissement(s) : | Limoges |
Ecole(s) doctorale(s) : | École doctorale Ω-LIM-Biologie-Chimie-Santé (Limoges ; 2022-) |
Partenaire(s) de recherche : | Laboratoire : Vieillissement Fragilité Prévention e-Santé (Limoges) |
Mots clés
Mots clés libres
Résumé
L'objectif de cette thèse est de construire et de valider une stratégie et un algorithme d'intelligence artificielle pour la prévention de la chute chez les personnes âgées. La chute est l'un des événements indésirables qui survient chez les personnes âgées. Une personne âgée est toute personne ayant 60 ans et plus. Les causes de la chute sont diverses et les conséquences peuvent être désastreuses. Une chute grave peut entraîner une hospitalisation, une admission dans un établissement d'hébergement pour personnes âgées dépendantes (EHPAD) ou la mort. La prévention de la chute est donc devenue une urgence pour accompagner les individus dans leur processus de vieillir en bonne santé. La chute est liée à la démarche et à l'équilibre. Nombreux sont les tests qui ont permis aux spécialistes d'évaluer le risque de chute chez leur patient. Ces tests leur ont permis d'assurer un plan de prévention du risque de chute. En effet, ces tests permettent d'évaluer directement les facteurs intrinsèques de la chute, à savoir la marche et l'équilibre. Parmi ces tests, on peut citer l'évaluation par l'échelle de Berg, l'évaluation par le Morse Fall Scale, le Tinetti's Performance-Oriented Mobility Assessment (POMA), le « Short Physical Performance Battery test » (SPPB) et le Timed Up and Go (TUG). Bien que ces tests soient efficaces, leur réalisation requiert un investissement important en temps et en ressources. Cependant, il convient de noter que ces tests sont de plus en plus automatisés du fait de la qualité des données qu'ils fournissent. D'ailleurs, les données collectées grâce à ces tests permettent d'enrichir les bases de données destinées à construire des modèles prédictifs de la chute. Le terme « donnée » fait ici référence à une information brute ou un ensemble d'observations recueillies dans le cadre d'une étude, d'une enquête, d'une visite à l'hôpital ou grâce à un système automatisé qui doit permettre d'extraire des informations pertinentes. Par information, on entend ici l'ensemble des résultats ou des connaissances qu'un modèle d'intelligence artificielle (IA) génère à partir des données d'entrées. Les données d'entrée sont les données de patients ou de sujets participants à une étude. L'IA est la science et l'ingénierie visant à créer des machines intelligentes, notamment des programmes informatiques intelligents. Un modèle d'IA est une construction mathématique générant une déduction ou une prédiction à partir de données d'entrée. Les causes d'une chute chez un individu sont multifactorielles. Elles sont liées à la santé physique, mentale et sociale de cet individu. Afin d'avoir une vision holistique de la chute, les données destinées à la prédiction impliquent les trois dimensions du risque de chute suivantes : la dimension physique/organique, la dimension thymique/cognitive et la dimension socio-environnementale. Le terme « dimension » fait référence aux types de facteurs qui contribuent au risque de chute chez une personne. Il s'agit de la façon d'appréhender les multiples facteurs qui peuvent influencer la probabilité de chute. Dans chacune des trois dimensions se trouvent des données pertinentes qui permettent de mieux comprendre les causes d'une chute. Les données peuvent provenir des hôpitaux, du domicile des participants d'une étude et des laboratoires de recherche où l'on utilise des capteurs ou des caméras. Elles peuvent prendre différentes formes telles que des nombres, des textes, des images, des vidéos ou des séries de valeurs mesurées. Pour prédire la chute, on doit prendre en compte au moins deux des trois dimensions du risque de chute, à savoir la dimension physique/organique et la dimension socio-environnementale. La dimension physique/organique est prise en compte pour collecter au moins des données liées à la marche ou l'équilibre. Pour donner un sens au procédé de prédiction de la chute, il faut au moins collecter l'âge du sujet qui s'inscrit dans la dimension socio-environnementale. Afin de construire un modèle prédictif avec une approche holistique de la chute, il faut considérer les trois dimensions du risque de chute. Les dimensions que l'on prend en compte lors de la prédiction de la chute dépendent de la provenance des données. Dans les hôpitaux, on peut trouver des données d'imagerie médicale, des données textuelles ou des données de patients lors de leur prise en charge qui sont répertoriées dans une base de données. Les données recueillies dans les hôpitaux prennent en compte les dimensions physique/organique (par exemple : le poids, la prise de la température et la mesure de la fréquence cardiaque) et socio-environnementale (par exemple : l'âge et le sexe) des patients. En plus, la dimension thymique/cognitive est mise en jeu par les données issues d'examens neurologiques ou d'entretiens psychiatriques. Les données d'entretiens psychiatriques sont obtenues grâce à des questionnaires standardisés. En dehors des hôpitaux, les données peuvent être recueillies durant des études menées dans des laboratoires de recherche ou au domicile des sujets participants. Au domicile des sujets participants, les données collectées impliquent les trois dimensions du risque de chute. Dans les laboratoires de recherche, les données sont recueillies grâce à des capteurs tels que des caméras, des capteurs de présence, des capteurs de déplacement, etc. Ces données peuvent être des images, des séries de valeurs numériques mesurées ou des vidéos. Les données obtenues grâce aux capteurs ne prennent en compte que les dimensions physique/organique et socio-environnementale du risque de chute. En revanche, les données qui sont issues de caméras impliquent les trois dimensions du risque de chute. Afin de construire un modèle prédictif de la chute pour des personnes âgées via des capteurs, une distinction entre la prédiction et la détection doit être précisée. Un modèle prédictif permet de faire des prédictions ou des estimations sur des événements futurs à partir de données existantes. La détection fait ici référence à l'identification ou à la reconnaissance de la chute par des dispositifs munis de capteurs. Lors d'un processus de prédiction, la population d'étude est constituée de personnes de tous âges. Dans la pratique, les données utilisées pour construire des modèles prédictifs sont collectées à partir de simulations de chutes réelles réalisées par des personnes de moins de 60 ans. Les modèles construits avec ces données ne sont ensuite validés qu'en utilisant des données de chutes réelles de personnes âgées. Les modèles prédictifs développés pour la prédiction sont intégrés à des outils de détection de la chute destinés aux personnes âgées. Ces outils collectent des données pendant leur utilisation. Les données réelles collectées lors de la détection de la chute sont également connues sous le nom de « données du monde réel » ou « Real World Data » en anglais. Les personnes âgées ne sont pas accompagnées lors de l'utilisation des dispositifs. Les capteurs ne pouvant pas mesurer l'intentionnalité du geste, afin d'assurer la fiabilité des données collectées lors de la détection de la chute, une distinction entre les chutes, les quasi-chutes (par exemple : glissade et trébuchement) et les activités de la vie quotidienne (par exemple : marcher, se tenir tranquillement debout et se lever d'une position assise) doit être faite lors de la construction d'un modèle prédictif. En d'autres termes, les données de chacun de ces événements doivent être incluses dans la construction du modèle pour que les dispositifs puissent les identifier lors de la détection. Prenons l'exemple d'une personne qui ramasse un objet, elle va se trouver à un niveau inférieur par rapport à sa position de départ, pourtant elle n'est pas en train de chuter. Le fait de ramasser un objet est une activité de la vie quotidienne, il n'a pas lieu avec la même vitesse qu'une chute ou une quasi-chute. Une personne qui chute peut avoir du mal à se souvenir des circonstances de sa chute. Les capteurs permettent de recueillir des données en temps réel, ce qui permet d'éviter les longs couchages (une personne est victime de long couchage si elle n'arrive pas à se lever après une chute) et la perte d'informations sur les circonstances d'une chute (des capteurs comme les accéléromètres par exemple permettent de mesurer la vitesse à laquelle une chute survient). Les dispositifs munis de capteurs permettent de lancer des alertes aux spécialistes, ce qui permet d'accélérer la prise en charge des personnes qui chutent. Selon le type de données, il existe de nombreux modèles d'intelligence artificielle qui permettent de prédire la chute. Ces modèles sont fondés sur l'apprentissage automatique (Machine Learning en anglais) ou profond (Deep Learning en anglais). Une fois que ces modèles ont permis de prédire la chute avec de bons scores de prédictions, il est important d'identifier les facteurs prédictifs. Les facteurs prédictifs sont les variables qui prédisent mieux un modèle, c'est-à-dire celles qui ont une relation statistique significative avec la variable que l'on souhaite prédire. Une variable est une caractéristique commune à l'ensemble des individus d'une étude. Après une prédiction, chaque variable d'entrée a un poids compris entre 0 et 1. Ce poids indique la contribution de la variable d'entrée à la prédiction de la variable cible. Les variables d'entrée qui ont les poids les plus importants sont les facteurs prédictifs ou variables prédictives du modèle. Les facteurs prédictifs permettent donc de fournir aux spécialistes les informations nécessaires pour la mise en place d'un plan de prévention de la chute ciblé. Les facteurs prédictifs peuvent être identifiés grâce aux modèles de régression ou d'IA explicable. Une IA explicable, encore appelée IA explicite ou transparente, est une intelligence artificielle dont on peut comprendre le comportement et donc les décisions, on peut les expliquer et les justifier. La régression est une technique statistique utilisée pour modéliser la relation entre une variable indépendante (ou variable d'entrée) et une variable dépendante (ou variable cible) dans un ensemble de données. Elle vise à trouver une relation mathématique qui permet de prédire la valeur de la variable cible en fonction des valeurs des variables d'entrées. Si on prend l'exemple d'une classification, les individus sont répartis dans des groupes en fonction des classes de la variable cible. Les modèles de régression permettent d'identifier les facteurs prédictifs dans chacun de ces groupes. Par ailleurs, avec les modèles fondés sur l'IA explicable, on arrive à identifier en plus les facteurs prédictifs spécifiques à chaque individu, ainsi que l'importance de chaque facteur prédictif dans la survenue des chutes. Dans notre travail, nous avons répertorié des études sur la prédiction des chutes des personnes âgées et qui ont identifié des facteurs prédictifs. Nous avons ensuite classifié les facteurs prédictifs de ces études en fonction des différentes dimensions du risque de chute. Nous avons noté qu'au moins une variable de la dimension physique/organique est un facteur prédictif dans chacune de ces études. La dimension physique/organique est donc nécessaire pour mettre en place une bonne stratégie de prévention de la chute. De plus, parmi les études répertoriées, les études récentes mettent en évidence l'âge comme un facteur prédictif de la chute. C'est ce qui justifie le besoin pressant de construire des modèles prédictifs pour les premières victimes de la chute, à savoir les personnes âgées. Dans les études répertoriées, les modèles d'IA qui ont permis de mettre en place des méthodologies de prédiction de la chute des personnes âgées avec de bons scores prédictifs sont les suivants : la Régression Lasso, le Random-forest-based Boruta algorithm, le Bidirectional encoder, le Bidirectional long short-term memory (BLSTM), l'arbre de régression et le Genetic Algorithm Neural Network (GANN). Ces modèles pourront constituer notre point de départ pour la construction de notre modèle prédictif d'IA pour la prédiction des chutes chez les personnes âgées. À l'étape de mise en place du modèle d'IA prédictive, ces modèles pourront constituer une base de départ pour la prédiction des chutes chez les personnes âgées.