Thèse soutenue

Constitution d'un corpus oral deFLE : enjeux théoriques et méthodologiques

FR  |  
EN
Auteur / Autrice : Najib Arbach
Direction : Marie-Claude Le Bot
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 06/02/2015
Etablissement(s) : Rennes 2
Ecole(s) doctorale(s) : École doctorale Sciences humaines et sociales (Rennes)
Partenaire(s) de recherche : PRES : Université européenne de Bretagne
Laboratoire : Analyse, Ingénierie et Didactique des langues et langages spécialisés
Jury : Président / Présidente : Paul Cappeau
Examinateurs / Examinatrices : Dominique Legallois, Élisabeth Richard
Rapporteur / Rapporteuse : Paul Cappeau, Dominique Legallois

Résumé

FR  |  
EN

Les méthodologies de constitution de corpus linguistiques ont été amplement étudiées, mais sont moins abondantes quand il s’agit de corpus oraux ; ces méthodologies sont encore plus rares en ce qui concerne l’interlangue orale. Le projet CIL (Corpus Inter Langue), en cours de finalisation à l’Université Rennes 2 et sous la supervision de l’équipe d’accueil LIDILE (EA 3874), vise à la constitution d’un corpus de productions écrites et orales d’apprenants en FLE et ALE. Cette thèse concerne le corpus oral de FLE du projet global (CIL-FLE). Partant du constat que l’intérêt des linguistes pour la langue orale a systématiquement été en retard par rapport à celui porté à la langue écrite, nous nous intéressons dans un premier temps à l’étude de l’oralité dans différents domaines de la linguistique d’un point de vue historique et épistémologique. Le second chapitre est consacré à la linguistique de corpus de manière générale et au corpus en tant qu’objet linguistique en particulier. En ce qui concerne la linguistique de corpus, nous tentons de présenter les différentes méthodologies auxquelles les linguistes ont recours lorsqu’il s’agit de consulter des données : introspection, élicitation ou consultation de données authentiques. Le concept de corpus est ensuite analysé selon un ensemble de critères définitoires que nous étudions en détail, afin de proposer une définition du corpus linguistique. Le troisième et dernier chapitre est la mise en application des constats théoriques dans la constitution du corpus CIL-FLE : nous détaillons lesconstituants du corpus, les protocoles de collecte et d’archivage. C’est au protocole de transcription que nous nous intéressons en particulier, en insistant sur les difficultés de la transcription de l’interlangue. Le corpus CILFLE, qui représente environ 105000 mots, représente le fruit de ce travail et sera ainsi détaillé.