Thèse soutenue

Web sémantique et mémoire d'expériences pour l'analyse du transcriptome

FR  |  
EN
Auteur / Autrice : Mohamed Khaled Khelif
Direction : Rose Dieng-Kuntz
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2006
Etablissement(s) : Nice
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Sophia Antipolis, Alpes-Maritimes)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Cette thèse rentre dans le cadre du projet MEAT (Mémoire d'Expériences pour l'Analyse du Transcriptome) dont le but est d'assister les biologistes travaillant dans le domaine des puces à ADN, pour l'interprétation et la validation de leurs résultats. Nous proposons une aide méthodologique et logicielle pour construire une mémoire d'expériences pour ce domaine. Notre approche, basée sur les technologies du web sémantique, repose sur l'utilisation des ontologies et des annotations sémantiques sur des articles scientifiques et d'autres sources de connaissances du domaine. Dans une première partie, nous proposons une ontologie modulaire pour la description des connaissances du domaine des puces à ADN (base de données d'expériences, articles scientifiques, entités biomédicales. . . ). Cette ontologie intègre entre autres, l'ontologie déjà existante UMLS, ce qui nous a permis d'approfondir le problème de réutilisation d'ontologies et leur adaptation à une nouvelle application. Ensuite, nous proposons une méthodologie générique pour la génération d'annotations sémantiques basées sur cette ontologie en exploitant les connaissances contenues dans les textes. Cette méthodologie a l'originalité d'utiliser des techniques de traitement automatique de la langue et des grammaires d'extraction de relations pour extraire automatiquement des articles scientifiques les relations reliant des termes d'UMLS reconnus dans le texte. Un système supportant cette méthodologie a été implémenté et validé par nos collègues biologistes. Enfin, pour faciliter la diffusion des connaissances contenues dans la mémoire, nous proposons un prototype qui se base sur un moteur de recherche sémantique (Corese) et qui exploite la base d'annotations que nous avons constituée. Cette partie du travail a permis d'améliorer la tâche de recherche d'informations en la rendant plus efficace et en offrant des mécanismes de raisonnement sur les connaissances du domaine.