Thèse soutenue

"Nouvelles méthodes en Data-Mining et extraction de connaissances à partir de données :application au complexe mycobacterium tuberculosis"

FR  |  
EN
Auteur / Autrice : Georges Valétudie
Direction : Jacky Desachy
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2006
Etablissement(s) : Antilles-Guyane

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Le besoin de tratement et d'extraction de connaissances à partir de larges bases de données en constante augmentation, a été à l'origine du développement de techniques et méthodes liées au data-Mining ou Knowledge discovery in databases. Cette discipline en pleine effervecence,regroupe différents domaines de compétences,intégrant notamment les techniques de gestion de base de données et les méthodes d'apprentissage et de prediction. Les procédures de traitement et d'analyse de données séquentielles. Ceci permet de déterminer les séquences les plus discriminantes de classes d'individus,définies à priori par les experts du domaine, et d'automatiser par des règles de connaissances,les procédures de traitement de séquences d'ADN. Nous avons donc cherché à mettre en oeuvre, des systèmes de spoligotypage. Nous avons mesuré l'impact de méthodes adaptées à notre domaine d'application en terme de performances, en tenant compte des contraintes qu'elles imposent. Par ailleurs, nous avons conçu un indice permettant de mieux prendre en compte l'aspect séquentiel de nos données, et presenté une méthode solidement basée sur l'inférence statistique,permettant de définir des règles de décisions concises, à partir d'une représentation condensée sous la forme d'un AEF. Bien qu'il soit encore prématuré de procéder à une sélection de méthodes, les expérimentations menées ont fourni de bons résultat. En fait, l'étude des possibilités d'approches coopératives entre méthodes semble être une voie pleine de promesses. Le champ d'étude reste encore vaste, pour un domaine d'application ou l'apport des méthodes d'extration automatique de connaissances demeure sans contexte un atout majeur.