Detecting anomalies in modern IT systems through the inference of structure and the detection of novelties in system logs

Oihana Coustié

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Détection d’anomalies dans les systèmes d’information modernes grâce à des méthodes d’inférence de structure et de détection de nouveautés dans les logs

FR |

EN

Auteur / Autrice :	Oihana Coustié
Direction :	Olivier Teste, Josiane Mothe
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 11/05/2021
Etablissement(s) :	Toulouse 1
Ecole(s) doctorale(s) :	École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche :	Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....)

Mots clés

FR |

EN

Mots clés contrôlés

Apprentissage profond

Détection des anomalies (informatique)

Systèmes informatiques -- Mesures de sûreté

Mots clés libres

Analyse de logs

Inférence de structure

Analyse syntaxique

Résumé

FR |

EN

Les anomalies dans les logs des systèmes d’information sont souvent le signe de failles ou de vulnérabilités. Leur détection automatique est difficile à cause du manque de structure dans les logs, et de la complexité des anomalies. Les méthodes d’inférence de structure existantes sont peu flexibles : elles ne sont pas paramétriques, ou reposent sur des hypothèses syntaxiques fortes, qui s’avèrent parfois inadéquates. Les méthodes de détection d’anomalies adoptent quant à elles une représentation des données qui néglige le temps écoulé entre les logs, et sont donc inadaptées à la détection d’anomalies temporelles. La contribution de cette thèse est double. Nous proposons d’abord METING, une méthode d’inférence de structure paramétrique et modulable. METING ne repose sur aucune hypothèse syntaxique forte, mais se base sur l’exploration de motifs fréquents, en étudiant les n-grammes des logs. Nous montrons expérimentalement que METING surpasse les méthodes existantes, avec d’importantes améliorations sur certains jeux de données. Nous montrons également que la sensibilité de notre méthode à ses hyper-paramètres lui permet de s’adapter à l’hétérogénéité des jeux de données. Enfin, nous proposons une extension de METING au contexte de la racinisation en traitement automatique du texte, et montrons que notre approche fournit une racinisation multilingue, sans règle, et plus efficace que la méthode de Porter, référence de l’état de l’art. Nous présentons également NoTIL, une méthode de détection de nouveautés par apprentissage profond. NoTIL utilise une représentation des données capable de détecter les irrégularités temporelles dans les logs. Notre méthode repose sur l’apprentissage d’une tâche de prédiction intermédiaire pour modéliser le comportement nominal des logs. Nous comparons notre méthode à celles de l’état de l’art et concluons que NoTIL est la méthode capable de traiter la plus grande variété d’anomalies, grâce aux choix de sa représentation des données.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Détection d’anomalies dans les systèmes d’information modernes grâce à des méthodes d’inférence de structure et de détection de nouveautés dans les logs

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Détection d’anomalies dans les systèmes d’information modernes grâce à des méthodes d’inférence de structure et de détection de nouveautés dans les logs

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses