Thèse soutenue

Analyse de sequences biologiques : developpement d'une approche independante d'un systeme de reference par traitement du gisnal

FR  |  
EN
Auteur / Autrice : EMMANUELLE OLLIVIER
Direction : Jean Guerdoux
Type : Thèse de doctorat
Discipline(s) : Sciences biologiques et fondamentales appliquées. Psychologie
Date : Soutenance en 1990
Etablissement(s) : Paris 6

Résumé

FR

Les methodes d'analyse de sequences classiques reposant sur des techniques de comparaison lexicographiques, introduisent directement ou implicitement, par le biais de matrices de distances ou par l'intermediaire de codes decrivant des relations de proximite entre symboles, un point de vue particulier sur les sequences comparees. Le travail presente dans cette these concerne le developpement d'une methode d'analyse independante de tout systeme de reference. Notre demarche se singularise des methodes plus classiques par le fait qu'elle ne porte pas sur une comparaison lexicale pure mais qu'elle opere sur une representation des sequences sous forme de signaux. La methode developpee repose sur l'utilisation d'une transformation orthogonale (transformee de fourier) et d'une procedure d'optimisation. Les sequences sont caracterisees globalement par des ensembles de couples (code, frequence): une frequence revele une contrainte particuliere dans l'organisation des symboles et le code qui lui est associe correspond a la relation de proximite entre symboles la plus adaptee a la mise en evidence de cette contrainte. Differents outils, egalement issus du domaine de l'analyse du signal, permettent de relocaliser l'information et d'extraire, des sequences initiales, les fragments exprimant les contraintes reperees. La methode est illustree sur deux familles de proteines: les proteines fixant le calcium et les proteases a serine. Nous envisageons egalement l'utilisation de cette methode d'analyse au cas particulier des sequences nucleiques et suggerons, dans ce domaine, quelques formes d'evolution possible du logiciel