Thèse soutenue

Extraction automatique d'arguments par le biais de grands modèles de langage adaptés

FR  |  
EN
Auteur / Autrice : Umer Mushtaq
Direction : Jérémie Cabessa
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 10/11/2023
Etablissement(s) : Université Paris-Panthéon-Assas
Ecole(s) doctorale(s) : École doctorale des sciences économiques et gestion, sciences de l'information et de la communication (Paris)
Jury : Examinateurs / Examinatrices : Farah Benamara, Elena Cabrio, Florence Dupin de Saint Cyr-Bannay, Maria Rifqi
Rapporteurs / Rapporteuses : Farah Benamara, Elena Cabrio

Résumé

FR  |  
EN

Le traitement automatique du langage naturel (NLP) est un champ de l'intelligence artificielle d'une importance majeure. Dans ce domaine les transformeurs et les modèles de langage de grandes tailles (LLMs) subséquents ont représenté un changement de paradigme significatif. Dans le cadre du NLP, l'extraction d'arguments (AM) se concentre sur la détection automatique d'arguments structurés et de leurs relations au sein d'un corpus textuel. L'extraction d'arguments possède de multiples applications, telles que l'analyse de texte juridiques ou d'articles scientifiques. Ce travail de thèse concerne l'extraction d'arguments (AM) et les modèles de langage de grande taille (LLMs). Notre première contribution concerne la classification d'arguments. Nous proposons un modèle unifié de type BERT enrichi de caractéristiques contextuelle structurelles et syntaxiques additionnelles, données sous forme de texte. Notre deuxième contribution concerne également la classification d'arguments ainsi que l'identification des liens entre ces derniers. Cette fois, nous proposons BERT--MINUS, un modèle composé d plusieurs sous-modules de type BERT, capable d'intégrer des caractéristiques additionnelles sous forme de texte ainsi que d'accomplir du transfert d'apprentissage. Notre troisième contribution se situe à la jonction des systèmes argumentatifs et de la théorie de la décision. Dans ce contexte, nous définissons un formalisme appelé ''Bipolar Layered Framework with Support and Weights'' (BLFSW), qui offre un modélisation des structures argumentatives sous forme de graphes. L'expressivité étendue de ce formalisme permet à la fois d'affiner l'évaluation des processus décisionnelles.