Apprentissage incrémental en ligne sur flux de données

Christophe Salperwyck

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Apprentissage incrémental en ligne sur flux de données

FR |

EN

Auteur / Autrice :	Christophe Salperwyck
Direction :	Philippe Preux
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 30/11/2012
Etablissement(s) :	Lille 3
Ecole(s) doctorale(s) :	École doctorale Sciences pour l'ingénieur (Lille)
Partenaire(s) de recherche :	Laboratoire : INRIA Lille - Nord Europe / INRIA Nancy - Grand Est / LIFL
Jury :	Président / Présidente : Younès Bennani
	Examinateurs / Examinatrices : Philippe Preux, Younès Bennani, Pascale Kuntz-Cosperec, Djamel Abdelkader Zighed, Vincent Lemaire, René Quiniou
	Rapporteurs / Rapporteuses : Pascale Kuntz-Cosperec, Djamel Abdelkader Zighed

Mots clés

FR |

EN

Mots clés contrôlés

Données -- Transmission

Mots clés libres

Apprentissage incrémental

Changements de concept

Flux de données

Résumé

FR |

EN

L'apprentissage statistique propose un vaste ensemble de techniques capables de construire des modèles prédictifs à partir d'observations passées. Ces techniques ont montré leurs capacités à traiter des volumétries importantes de données sur des problèmes réels. Cependant, de nouvelles applications génèrent de plus en plus de données qui sont seulement visibles sous la forme d'un flux et doivent être traitées séquentiellement. Parmi ces applications on citera : la gestion de réseaux de télécommunications, la modélisation des utilisateurs au sein d'un réseau social, le web mining. L'un des défis techniques est de concevoir des algorithmes permettant l'apprentissage avec les nouvelles contraintes imposées par les flux de données. Nous proposons d'abord ce problème en proposant de nouvelles techniques de résumé de flux de données dans le cadre de l'apprentissage supervisé. Notre méthode est constituée de deux niveaux. Le premier niveau utilise des techniques incrémentales de résumé en-ligne pour les flux qui prennent en compte les ressources mémoire et processeur et possèdent des garanties en termes d'erreur. Le second niveau utilise les résumés de faible taille, issus du premier niveau, pour construire le résumé final à l'aide d'une méthode supervisée performante hors-ligne. Ces résumés constituent un prétraitement qui nous permet de proposer de nouvelles versions du classifieur bayésien naïf et des arbres de décision fonctionnant en-ligne sur flux de données. Les flux de données peuvent ne pas être stationnaires mais comporter des changements de concept. Nous proposons aussi une nouvelle technique pour détecter ces changements et mettre à jour nos classifieurs.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Apprentissage incrémental en ligne sur flux de données

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Apprentissage incrémental en ligne sur flux de données

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses