Thèse soutenue

Recherche d'associations séquentielles et alignement d'ontologies biologiques

FR  |  
EN
Auteur / Autrice : Bastien Rance
Direction : Christine Froidevaux
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2009
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Le thème principal de cette thèse est l’annotation fonctionnelle, qui consiste à associer à une protéine sa ou ses fonctions biologiques. Nous nous sommes intéressés à deux aspects. Dans un premier temps, nous avons testé l’hypothèse biologique selon laquelle l’ordre des domaines dans une protéine pourrait jouer un rôle dans la fonction biologique de celle-ci. Pour cela, nous avons introduit la notion de pépites séquentielles de connaissance comme une association séquentielle entre séquence d’items et une cible déterminée. Nous avons conçu et implémenté SNK, un algorithme pour rechercher ces pépites. Pour répondre à un besoin de nos collaborateurs, nous avons étendu l’algorithme SNK en lui donnant une spécification plus adaptée à la biologie, puis nous avons utilisé avec succès SNK pour l’étude d’une famille protéique. Dans un second temps, nous avons travaillé sur les ontologies biologiques et les hiérarchies fonctionnelles que les experts biologistes utilisent pour l’annotation. Il existe de ces vocabulaires contrôlés et structurés exprimant chacun un point de vue sur l’annotation. Pour permettre de travailler avec l’ensemble de ces données d’annotation dans le cadre de travaux de génomique comparative. Il est apparu nécessaire de mettre en correspondance des ontologies biologiques. Nous avons choisi de développer une méthode de mapping, O’Browser, prenant en compte les spécificités des ontologies biologiques, en introduisant un matcher utilisant les relations d’homologie entre les protéines annotées par ces ontologies et la notion de pondération adaptative des ces matchers. Cette méthode a été utilisée pour l’alignement de deux hiérarchies fonctionnelles.