Inférence de réseaux d'interaction protéine-protéine par apprentissage statistique

Céline Brouard

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Inférence de réseaux d'interaction protéine-protéine par apprentissage statistique

FR |

EN

Auteur / Autrice :	Céline Brouard
Direction :	Florence D'Alché-Buc, Aleksander Edelman
Type :	Thèse de doctorat
Discipline(s) :	Bioinformatique
Date :	Soutenance le 14/02/2013
Etablissement(s) :	Evry-Val d'Essonne
Ecole(s) doctorale(s) :	Ecole doctorale des Génomes aux organismes (Versailles ; 2000-2015)
Jury :	Président / Présidente : Christine Froidevaux
	Examinateurs / Examinatrices : Éric Angel, Franck Brouillard
	Rapporteur / Rapporteuse : Jean-Philippe Vert, François Laviolette

Mots clés

FR |

EN

Mots clés contrôlés

Apprentissage automatique

Noyaux (analyse fonctionnelle)

Interactions protéine-protéine

Mots clés libres

Prédiction de liens

Résumé

FR |

EN

L'objectif de cette thèse est de développer des outils de prédiction d'interactions entre protéines qui puissent être appliqués en particulier sur le réseau d’interaction autour de la protéine CFTR, qui est impliquée dans la mucoviscidose. Le développement de méthodes de prédiction in silico peut s'avérer utile pour suggérer aux biologistes de nouvelles cibles d'interaction. Nous proposons une nouvelle méthode pour la prédiction de liens dans un réseau. Afin de bénéficier de l'information des données non étiquetées, nous nous plaçons dans le cadre de l'apprentissage semi-supervisé. Nous abordons ce problème de prédiction comme une tâche d'apprentissage d'un noyau de sortie. Un noyau de sortie est supposé coder les proximités existantes entres les nœuds du graphe et l'objectif est d'approcher ce noyau à partir de descriptions appropriées en entrée. L'utilisation de l'astuce du noyau dans l'ensemble de sortie permet de réduire le problème d'apprentissage à celui d'une fonction d'une seule variable à valeurs dans un espace de Hilbert. En choisissant les fonctions candidates pour la régression dans un espace de Hilbert à noyau reproduisant à valeur opérateur, nous développons, comme dans le cas de fonctions à valeurs scalaires, des outils de régularisation. Nous établissons en particulier des théorèmes de représentation, qui permettent de définir de nouveaux modèles de régression. Nous avons testé l'approche développée sur des données artificielles, des problèmes test ainsi que sur un réseau d'interaction chez la levure et obtenu de très bons résultats. Puis nous l'avons appliquée à la prédiction d'interactions entre protéines dans le cas d'un réseau construit autour de CFTR.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Inférence de réseaux d'interaction protéine-protéine par apprentissage statistique

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Inférence de réseaux d'interaction protéine-protéine par apprentissage statistique

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses