Thèse soutenue

Architectures réparties et conteneurs logiciels sécurisés pour coopérations médicales multi-sites

FR  |  
EN
Auteur / Autrice : Sirine Sayadi
Direction : Mario SüdholtPierre-Antoine Gourraud
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 05/12/2022
Etablissement(s) : Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Software Stack for Massively Geo-Distributed Infrastructures - Département Automatique, Productique et Informatique - Laboratoire des Sciences du Numérique de Nantes
Jury : Président / Présidente : Walid Gaaloul
Examinateurs / Examinatrices : Mario Südholt, Pierre-Antoine Gourraud, Marc Cuggia, Anne-Sophie Jannot, Nicolas Vince
Rapporteurs / Rapporteuses : Walid Gaaloul, Marc Cuggia

Résumé

FR  |  
EN

L’analyse de larges quantités de données biomédicales permet d’obtenir une meilleure précision des résultats et aide les chercheurs et les cliniciens à établir de bonnes diagnostiques et prendre les bonnes décisions. Les collaborations nationales et internationales qui explorent la médecine de précision se fondent sur des analyses sur des données provenant de populations variées et nombreuses. Les analyses biomédicales actuelles sont sujets à des problèmes en terme de protection de données. Dans cette thèse multidisciplinaire, nous contribuons à la résolution de ces problèmes par le développement d’analyses de données biomédicales distribuées ainsi que par leur déploiement dans des infrastructures informatiques et leur intégration dans des outils médicaux réels. Dans le cadre d’une application de transplantation rénale, nous proposons une nouvelle solution de contextualisation distribuée qui aide les cliniciens à évaluer les problèmes rénaux de patients. Pour la même application nous proposons également une nouvelle version distribuée de l’analyse factorielle des données mixtes (FAMD) pour la réduction des dimensions. Dans le cadre des données HLA, nous proposons un nouveau modèle distribué et sécurisé pour l’estimation de fréquences appliquées sur des bases de données HLA. Nous proposons également un nouveau algorithme pour l’estimation distribuée de la fréquence d’haplotypes HLA en utilisant l’algorithme EM. Toutes nos contributions ont été déployées sur une infrastructure réelle de nuage géodistribués et évaluées sur des données réelles ou réalistes. Les expérimentations ont montré de (très) bons résultats en terme de performances comparés aux solutions centralisées.