Analyses de données omiques : clustering et inférence de réseaux

Audrey Hulot

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Analyses de données omiques : clustering et inférence de réseaux

FR |

EN

Auteur / Autrice :	Audrey Hulot
Direction :	Henri-Jean Garchon, Florence Jaffrézic, Julien Chiquet
Type :	Thèse de doctorat
Discipline(s) :	Sciences de la vie et de la santé
Date :	Soutenance le 26/11/2020
Etablissement(s) :	université Paris-Saclay
Ecole(s) doctorale(s) :	École doctorale Structure et Dynamique des Systèmes Vivants
Partenaire(s) de recherche :	Laboratoire : Génétique animale et biologie intégrative (Jouy-en-Josas,Yvelines ; 2009-....) - Génétique Animale et Biologie Intégrative / GABI
	référent : Université de Versailles-Saint-Quentin-en-Yvelines (1991-....)
Jury :	Président / Présidente : Marie-Laure Martin-Magniette
	Examinateurs / Examinatrices : Nathalie Villa-Vialaneix, Grégory Nuel, Guillemette Marot-Briend, Guillaume Assié
	Rapporteurs / Rapporteuses : Nathalie Villa-Vialaneix, Grégory Nuel

Mots clés

FR |

EN

Mots clés contrôlés

Développement

Réseaux d'ordinateurs

Biologie -- Méthodologie

Intégration de données (informatique)

Marqueurs biologiques

Analyse des données

Mots clés libres

Intégration de données

Résumé

FR |

EN

Le développement des méthodes de biologie haut-débit (séquençage et spectrométrie de masse) a permis de générer de grandes masses de données, dites -omiques, qui nous aident à mieux comprendre les processus biologiques.Cependant, isolément, chaque source -omique ne permet d'expliquer que partiellement ces processus. Mettre en relation les différentes sources de donnés -omiques devrait permettre de mieux comprendre les processus biologiques mais constitue un défi considérable.Dans cette thèse, nous nous intéressons particulièrement aux méthodes de clustering et d’inférence de réseaux, appliquées aux données -omiques.La première partie du manuscrit présente trois méthodes. Les deux premières méthodes sont applicables dans un contexte où les données peuvent être de nature hétérogène.La première concerne un algorithme d’agrégation d’arbres, permettant la construction d’un clustering hiérarchique consensus. La complexité sous-quadratique de cette méthode a fait l’objet d’une démonstration, et permet son application dans un contexte de grande dimension. Cette méthode est disponible dans le package R mergeTrees, accessible sur le CRAN.La seconde méthode concerne l’intégration de données provenant d’arbres ou de réseaux, en transformant les objets via la distance cophénétique ou via le plus court chemin, en matrices de distances. Elle utilise le Multidimensional Scaling et l’Analyse Factorielle Multiple et peut servir à la construction d’arbres et de réseaux consensus.Enfin, dans une troisième méthode, on se place dans le contexte des modèles graphiques gaussiens, et cherchons à estimer un graphe, ainsi que des communautés d’entités, à partir de plusieurs tables de données. Cette méthode est basée sur la combinaison d’un Stochastic Block Model, un Latent block Model et du Graphical Lasso.Cette thèse présente en deuxième partie les résultats d’une étude de données transcriptomiques et métagénomiques, réalisée dans le cadre d’un projet appliqué, sur des données concernant la Spondylarthrite ankylosante.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Analyses de données omiques : clustering et inférence de réseaux

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Analyses de données omiques : clustering et inférence de réseaux

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses