Thèse soutenue

Représentation formelle avec AZee et contraintes grammaticales pour la langue des signes française

FR  |  
EN
Auteur / Autrice : Camille Challant
Direction : Michael Filhol
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 03/12/2024
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication
Partenaire(s) de recherche : Laboratoire : Laboratoire Interdisciplinaire des Sciences du Numérique
Référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury : Président / Présidente : Agata Savary
Examinateurs / Examinatrices : Sylvain Kahane, Laurence Meurant, Jean-Philippe Prost, Marion Blondel, Marie-Anne Sallandre
Rapporteurs / Rapporteuses : Sylvain Kahane, Laurence Meurant

Résumé

FR  |  
EN

Les langue des signes sont des langues qui disposent de très peu d'outils informatiques. Afin de remédier à cela, il est essentiel de décrire les langues formellement, c'est-à-dire que ces descriptions puissent être interprétées par des machines. AZee est une approche formelle qui permet de décrire des discours en langue des signes. Elle est fondée sur la notion de règle de production, qui associe à un sens donné un ensemble de formes signées. Cette approche permet de prendre en compte les spécificités des langues des signes comme la multilinéarité, la simultanéité ou l'iconicité, caractéristiques souvent délaissées dans les approches traditionnelles.Nous posons deux objectifs pour nos travaux de recherche : tester la couverture de l'ensemble des règles de production AZee sur un corpus et, si ce premier test s'avère être concluant, commencer à développer une grammaire formelle basée sur AZee.Dans un premier temps, nous avons testé la couverture de l'ensemble de production existant face au corpus des 40 brèves, un corpus d'une heure de langue des signes française, de genre journalistique.Suite au repérage d'un manque du modèle AZee au sujet des expressions faciales, nous avons commencé par mettre en application la méthodologie d'identification de règles de production. Cela nous a permis d'augmenter l'ensemble de production de 23 nouvelles règles.Nous avons ensuite décrit avec AZee l'ensemble du corpus des 40 brèves. Nous avons ainsi constitué le premier corpus de référence pour AZee, qui est mis à disposition de la communauté scientifique. Il contient 120 expressions AZee de discours, qui représentent les 120 vidéos qui constituent le corpus des 40 brèves.Nous avons obtenu une couverture du corpus par l'ensemble de production de près de 97%, ce qui nous a permis de confirmer la robustesse du modèle et d'entreprendre la deuxième étape de nos recherches.Nous avons ainsi, dans un second temps, étudié le corpus créé pour en faire émerger des contraintes grammaticales. En effet, les expressions AZee de discours représentant la langue, toute contrainte qui s'applique à la langue devrait se retrouver dans les expressions. Nous avons imaginé des requêtes pour faire des recherches dans le corpus et identifier ces contraintes. Nous en avons trouvé plusieurs, qui concernent le nombre de règles de production appliquées dans une expression, la racine de l'expression ou encore le type de la règle de production. Cela nous permet de poser les bases d'une grammaire formelle pour la langue des signes française, fondée sur l'approche AZee. Nous avons ensuite identifié les convergences et divergences entre la grammaire que nous proposons et des théories plus traditionnelles.Pour conclure, si l'approche AZee a été pensée à l'origine pour des besoins informatiques, nous montrons dans cette thèse qu'elle n'en reste pas moins pertinente dans le contexte des recherches en linguistique.