Thèse soutenue

Apprentissage de règles de classification expressives notamment à partir de données séquentielles

FR  |  
EN
Auteur / Autrice : Marine Collery
Direction : François Fages
Type : Thèse de doctorat
Discipline(s) : Informatique, données, IA
Date : Soutenance le 12/10/2023
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche : Laboratoire : Inria EPI Lifeware - Computational systems biology and optimization
Jury : Président / Présidente : Florence D'Alché-Buc
Examinateurs / Examinatrices : François Fages, Johannes Fürnkranz, Céline Hudelot, Claire Glanois, Siegfried Nijssen, Marc Schoenauer, Shubham Gupta
Rapporteurs / Rapporteuses : Johannes Fürnkranz, Céline Hudelot

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Au cours des dernières décennies, l’apprentissage automatique, et en particulieravec les réseaux de neurones, a fait d’énormes progrès pour résoudredes problèmes de classification dans différents domaines tels que la santé,la détection des fraudes ou la reconnaissance d’images. Ces modèles sontcapables d’apprendre à partir de différents types de données, allant des imagesaux séries temporelles, et d’atteindre une précision de classification impressionnante.Cependant, leurs décisions sont difficiles, voire impossibles àcomprendre par un être humain. Les méthodes basées sur des règles, quant àelles, sont interprétables, lisibles par l’homme et ont été largement adoptéesdans différents domaines industriels avec les Business Rule Management Systems(BRMS) ou systèmes de gestion des règles métier. En pratique, cependant,ces règles sont écrites manuellement par des experts. L’une des raisonspour laquelle les règles écrites manuellement ne peuvent pas être facilementremplacées par des modèles de règles apprises à partir de données, est queles modèles d’apprentissage de règles ne sont pas capables d’apprendre desrègles aussi expressives, avec des concepts de haut niveau et une grammairecomplexe. De plus, en raison d’un manque de représentations latentes, lesméthodes d’apprentissage basées sur des règles sont moins performantes queles réseaux neuronaux de l’état de l’art.Dans cette thèse, nous proposons une approche de bout en bout baséesur un réseau de neurones permettant d’apprendre des règles expressives pourdes problèmes de classification. Différents niveaux d’expressivité des règlessont présentés et évalués sur de nouvelles données synthétiques et sur certainsensembles de données existants. Tout d’abord, l’apprentissage d’expressionssous la forme normale disjonctive avec un réseau neuronal (modèle de base)est étudié. Ensuite, des extensions pour prendre en charge les donnéesséquentielles sont introduites avec une approche récursive et une approcheconvolutive. Enfin, le modèle est étendu pour apprendre des règles plusexpressives avec des fonctions d’agrégation prédéfinies et des règles de grammairecomplexes.