Thèse soutenue

Méthodes structurelles et sémantiques pour la mise en correspondance de cas textuels de dysmorphies fœtales

FR  |  
EN
Auteur / Autrice : Yves Jean Vincent Parès
Direction : Marie-Christine JaulentXavier Aimé
Type : Thèse de doctorat
Discipline(s) : Informatique médicale
Date : Soutenance le 01/12/2016
Etablissement(s) : Paris 6
Ecole(s) doctorale(s) : École doctorale Pierre Louis de santé publique : épidémiologie et sciences de l'information biomédicale (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique médicale et d'ingénierie des connaissances en e-santé (Paris ; 2014-....)
Jury : Examinateurs / Examinatrices : Pierre Zweigenbaum, Jean-Marie Jouannic
Rapporteurs / Rapporteuses : Isabelle Bichindaritz, Chantal Reynaud

Résumé

FR  |  
EN

Cette thèse se place dans le contexte d'Accordys, un projet d'ingénierie des connaissances qui vise à fournir un système de rapprochement de cas en fœtopathologie, qui est le domaine de l'étude des maladies rares et dysmorphies du fœtus. Ce projet se base sur un corpus de comptes rendus d'examens fœtaux. Ce matériel consiste en des comptes rendus en texte brut présentant un vocabulaire très spécifique (qui n'est que partiellement formalisé dans des terminologies médicales en français), des économies linguistiques (un style "prise de notes" très prononcé rendant difficile l'utilisation d'outils analysant la grammaire du texte) et une mise en forme matérielle exhibant une structuration commune latente (un découpage en sections, sous-sections, observations). Cette thèse vise à tester l'hypothèse qu'une uniformisation de la représentation des cas exploitant cette structure arborescente en la faisant correspondre à un modèle de cas (lui aussi arborescent) peut supporter la constitution d'une base de cas qui conserve les informations contenues dans les comptes rendus originaux et permette la mesure de similarité entre deux cas. La mise en correspondance entre cas et modèle (instanciation du modèle) est réalisée via un mapping d'arbres ayant pour base une méthode de Monte Carlo. Nous comparerons ceci avec des mesures de similarités obtenues en représentant nos comptes rendus (soit tels quels, soit enrichis sémantiquement grâce à un annotateur sémantique) dans un modèle vectoriel.