Improving IoT data stream analytics using summarization techniques

Maroua Bahri

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Amélioration de l’analyse des flux de données IoT à l’aide de techniques de réduction de données

FR |

EN

Auteur / Autrice :	Maroua Bahri
Direction :	Albert Bifet, Silviu Maniu
Type :	Thèse de doctorat
Discipline(s) :	Informatique, données, IA
Date :	Soutenance le 05/06/2020
Etablissement(s) :	Institut polytechnique de Paris
Ecole(s) doctorale(s) :	École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche :	établissement opérateur d'inscription : Télécom Paris (Palaiseau, Essonne ; 1878-....)
	Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....)
Jury :	Président / Présidente : João Gama
	Examinateurs / Examinatrices : Ons Jelassi, Cédric Gouy-Pailler, Mauro Sozio
	Rapporteurs / Rapporteuses : Moamar Sayed-Mouchaweh, Maguelonne Teisseire

Mots clés

FR |

EN

Mots clés contrôlés

Apprentissage supervisé (intelligence artificielle)

Mots clés libres

Internet des Objets

Flux de données

Apprentissage supervisé

Classification

Réduction de dimension

Résumés minimalistes

Résumé

FR |

EN

Face à cette évolution technologique vertigineuse, l’utilisation des dispositifs de l'Internet des Objets (IdO), les capteurs, et les réseaux sociaux, d'énormes flux de données IdO sont générées quotidiennement de différentes applications pourront être transformées en connaissances à travers l’apprentissage automatique. En pratique, de multiples problèmes se posent afin d’extraire des connaissances utiles de ces flux qui doivent être gérés et traités efficacement. Dans ce contexte, cette thèse vise à améliorer les performances (en termes de mémoire et de temps) des algorithmes de l'apprentissage supervisé, principalement la classification à partir de flux de données en évolution. En plus de leur nature infinie, la dimensionnalité élevée et croissante de ces flux données dans certains domaines rendent la tâche de classification plus difficile. La première partie de la thèse étudie l’état de l’art des techniques de classification et de réduction de dimension pour les flux de données, tout en présentant les travaux les plus récents dans ce cadre.La deuxième partie de la thèse détaille nos contributions en classification pour les flux de données. Il s’agit de nouvelles approches basées sur les techniques de réduction de données visant à réduire les ressources de calcul des classificateurs actuels, presque sans perte en précision. Pour traiter les flux de données de haute dimension efficacement, nous incorporons une étape de prétraitement qui consiste à réduire la dimension de chaque donnée (dès son arrivée) de manière incrémentale avant de passer à l’apprentissage. Dans ce contexte, nous présentons plusieurs approches basées sur: Bayesien naïf amélioré par les résumés minimalistes et hashing trick, k-NN qui utilise compressed sensing et UMAP, et l’utilisation d’ensembles d’apprentissage également.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Amélioration de l’analyse des flux de données IoT à l’aide de techniques de réduction de données

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Amélioration de l’analyse des flux de données IoT à l’aide de techniques de réduction de données

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses