Extraction automatique d'arguments par le biais de grands modèles de langage adaptés
Auteur / Autrice : | Umer Mushtaq |
Direction : | Jérémie Cabessa |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 10/11/2023 |
Etablissement(s) : | Université Paris-Panthéon-Assas |
Ecole(s) doctorale(s) : | École doctorale des sciences économiques et gestion, sciences de l'information et de la communication (Paris) |
Jury : | Examinateurs / Examinatrices : Farah Benamara, Elena Cabrio, Florence Dupin de Saint Cyr-Bannay, Maria Rifqi |
Rapporteurs / Rapporteuses : Farah Benamara, Elena Cabrio |
Mots clés
Mots clés contrôlés
Résumé
Le traitement automatique du langage naturel (NLP) est un champ de l'intelligence artificielle d'une importance majeure. Dans ce domaine les transformeurs et les modèles de langage de grandes tailles (LLMs) subséquents ont représenté un changement de paradigme significatif. Dans le cadre du NLP, l'extraction d'arguments (AM) se concentre sur la détection automatique d'arguments structurés et de leurs relations au sein d'un corpus textuel. L'extraction d'arguments possède de multiples applications, telles que l'analyse de texte juridiques ou d'articles scientifiques. Ce travail de thèse concerne l'extraction d'arguments (AM) et les modèles de langage de grande taille (LLMs). Notre première contribution concerne la classification d'arguments. Nous proposons un modèle unifié de type BERT enrichi de caractéristiques contextuelle structurelles et syntaxiques additionnelles, données sous forme de texte. Notre deuxième contribution concerne également la classification d'arguments ainsi que l'identification des liens entre ces derniers. Cette fois, nous proposons BERT--MINUS, un modèle composé d plusieurs sous-modules de type BERT, capable d'intégrer des caractéristiques additionnelles sous forme de texte ainsi que d'accomplir du transfert d'apprentissage. Notre troisième contribution se situe à la jonction des systèmes argumentatifs et de la théorie de la décision. Dans ce contexte, nous définissons un formalisme appelé ''Bipolar Layered Framework with Support and Weights'' (BLFSW), qui offre un modélisation des structures argumentatives sous forme de graphes. L'expressivité étendue de ce formalisme permet à la fois d'affiner l'évaluation des processus décisionnelles.