Thèse soutenue

Méthodes avancées pour la résolution du problème de maximum parcimonie

FR  |  
EN
Auteur / Autrice : Karla Esmeralda Vazquez Ortiz
Direction : David Lesaint
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance le 14/06/2016
Etablissement(s) : Angers
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et mathématiques (Nantes)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Etudes et de Recherche en Informatique d'Angers - Laboratoire d'Etudes et de Recherche en Informatique d'Angers
Jury : Président / Présidente : Christine Sinoquet
Examinateurs / Examinatrices : Thomas Schiex
Rapporteurs / Rapporteuses : Cyril Fonlupt, El-Ghazali Talbi

Résumé

FR  |  
EN

La reconstruction phylogénétique est considérée comme un élément central de divers domaines comme l’écologie, la biologie et la physiologie moléculaire pour lesquels les relations généalogiques entre séquences d’espèces ou de gènes, représentées sous forme d’arbres, peuvent apporter des éclairages significatifs à la compréhension de phénomènes biologiques. Le problème de Maximum de Parcimonie est une approche importante pour résoudre la reconstruction phylogénétique en se basant sur un critère d’optimalité pour lequel l’arbre comprenant le moins de mutations est préféré. Dans cette thèse nous proposons différentes méthodes pour s’attaquer à la nature combinatoire de ce problème NP-complet. Premièrement, nous présentons un algorithme de Recuit Simulé compétitif qui nous a permis de trouver des solutions de meilleure qualité pour un ensemble de problèmes. Deuxièmement, nous proposons une nouvelle technique de Path-Relinking qui semble intéressante pour comparer des arbres mais pas pour trouver des solutions de meilleure qualité. Troisièmement, nous donnons le code d’une implantation sur GPU de la fonction objectif dont l’intérêt est de réduire le temps d’exécution de la recherche pour des instances dont la longueur des séquences est importante. Finalement, nous introduisons un prédicteur capable d’estimer le score optimum pour un vaste ensemble d’instances avec une très grande précision.