Thèse en cours

Analyse de code auto adaptative pour les programmes adversariaux

FR  |  
EN
Auteur / Autrice : Charles babu Mamidisetti
Direction : Jean-Yves Marion
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 16/02/2021
Etablissement(s) : Université de Lorraine
Ecole(s) doctorale(s) : École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine (1992-....)
Partenaire(s) de recherche : Laboratoire : LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications

Résumé

FR  |  
EN

On considère le cas de l'analyse de code adversariaux, c'est-à-dire du code obfusqué destiné à gêner l'analyse, par exemple dans le cas de la compréhension de malware pour trouver la clé privée permettant de déverrouiller des fichiers cryptés par un ransomware). Alors que les récentes attaques basées sur la sémantique se sont avérées très fructueuses dans de tels contextes, la course aux armements est en marche et de puissantes défenses antisémantiques ont récemment été suggérées. Nous affirmons que le problème ici n'est pas dans les capacités de raisonnement des systèmes de cyber-raisonnement actuels au niveau binaire, mais plutôt dans leur utilisation fine. En effet, l'analyse réussit généralement une fois bien réglée par un expert à la fois de la rétro-ingénirie et des méthodes formelles, mais cela nécessite du temps et des compétences approfondies. En effet, les analyseurs sémantiques standards sont livrés avec un grand nombre de paramètres pour régler les compromis entre précision, coût, etc. Ces paramètres peuvent avoir un impact sur la recherche, les capacités de résolution, la granularité du raisonnement, l'heuristique intégrée pour certains types de codes, etc. , un raisonnement très précis ne se met pas à l'échelle, il n'est donc pas activé par défaut, et doit être finement délimité par l'utilisateur. Alors qu'un expert très qualifié peut le faire, la plupart des utilisateurs ne le peuvent pas. Ainsi, dans le contexte de l'analyse de code contradictoire (malware), nous voulons comprendre comment les techniques d'apprentissage automatique peuvent être utilisées pour détecter automatiquement un problème d'analyse, le comprendre, et ajuster l'analyse en conséquence, dans le but ultime de concevoir une analyse auto-adaptative capable de s'ajuster automatiquement aux protections antisémantiques - réduisant ainsi l' (énorme) écart entre les utilisateurs normaux et les experts