Thèse soutenue

Modélisation et résolution multi-objectifs des règles d'association : application à l'analyse de données biopuces

FR  |  
EN
Auteur / Autrice : Mohammed Khabzaoui
Direction : El-Ghazali TalbiClarisse Dhaenens
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2006
Etablissement(s) : Lille 1

Résumé

FR

La technologie haut débit des puces à ADN permet de visualiser simultanément le niveau d'expression de plusieurs milliers de gènes ou groupe de gènes dans des conditions différentes Cette technologie haut débit génère une grande diversité de données qui implique un important travail d'analyse. Une de ces problématiques, concerne la recherche de règles d'associations qui consiste à extraire un ensemble de formules logiques conditionnelles permettant de déduire la valeur d'un attribut but à partir des valeurs d'autres attributs. La recherche de règles d'association peut être vue comme un problème d'optimisation puisque l'on recherche les règles optimisant un certain critère. La combinatoire associée au problème est très importante. Ceci ne permet pas d'utiliser pour des problèmes de grandes tailles (comme c'est le cas ici) des algorithmes exactes d'énumération. Il est donc nécessaire d'avoir recours à des heuristiques telles que par exemple les métaheuristiques. Le contexte de la thèse étant la résolution d'un problème d'optimisation combinatoire multi-objectif pour l'analyse de données obtenues à l'aide de la technologie des puces à ADN, nous nous focalisons sur la modélisation et la résolution multi-objectif du problème de recherche de règles d'association. Puis nous nous intéressons à l'apport des méthodes d'optimisation approchées, à savoir les algorithmes génétiques (AG) Nous avons proposé un algorithme génétique permettant de traiter des bases de données relatives à des expérimentations sur puces à ADN. Cet algorithme possède un codage et des opérateurs adaptés à la recherche de règles d'association et des mécanismes multi-objectif ont été implémentés. Nous avons mis en place un mécanisme adaptatif pour pouvoir appliquer plusieurs mutations selon l'évolution de l'algorithme et adapter leur taux d'application en fonction de l'amélioration apportée par chacun d'eux. Nous avons proposé une approche parallèle développée pour le problème de recherche de règles, dans laquelle différents algorithmes génétiques coopèrent. Plusieurs approches coopératives ont été proposées. Nous avons montré à la fois l'apport du parallélisme et l'apport de la coopération entre méthodes de différents types.