Thèse en cours

De l'Alternance Tough en anglais : une analyse de corpus

FR  |  
EN
Auteur / Autrice : Arthur Leicht
Direction : Bert Cappelle
Type : Projet de thèse
Discipline(s) : Sciences du langage : linguistique et phonétique générales
Date : Inscription en doctorat le 01/10/2025
Etablissement(s) : Université de Lille (2022-....)
Ecole(s) doctorale(s) : École doctorale Sciences de l'homme et de la société
Partenaire(s) de recherche : Laboratoire : Savoirs, Textes, langages

Résumé

FR  |  
EN

La Construction Tough, illustrée par « John is hard to beat », présente une forme syntaxique en apparence simple, mais repose sur des relations sémantico-syntaxiques complexes. L'entité sujet n'est pas l'agent de l'action, mais son patient : ce n'est pas elle qui bat, mais celle qu'il faut battre. Cette particularité apparaît plus clairement dans la forme extraposée concurrente « It is hard to beat John », où cette entité occupe la position d'objet. Dans le cadre théorique de la Grammaire Générative, cette construction a suscité des débats depuis plus d'un demi-siècle (Chomsky 1977, 1981 ; Lasnik & Fiengo 1974). L'hypothèse dominante consistait à dériver la forme non-extraposée de sa contrepartie extraposée par mouvement syntaxique (Postal & Ross 1971 ; Rosenbaum 1967). Cependant, comme le notent Poole, Mendia et Keine (2024) : « Tough-constructions (TCs) have long been, and continue to be, a controversial topic, with even fundamental aspects of their syntax remaining under dispute. » Malgré l'abondance de travaux théoriques, l'usage réel de ces constructions n'a fait l'objet que de rares études empiriques. Celles qui existent se révèlent souvent limitées par l'absence de statistiques inférentielles ou par le faible nombre d'occurrences dans les corpus. Cette thèse propose donc d'articuler analyse empirique, modélisation probabiliste et perspectives théoriques. En Grammaire de Construction, les deux alternantes peuvent être considérées comme des constructions distinctes mais liées (Cappelle 2006). Cappelle (2024) propose d'intégrer ces « phénomènes de mouvement » dans ce modèle, où chaque construction est conçue comme une unité forme–fonction, la fonction intégrant des dimensions sémantiques et pragmatiques. Cette perspective rejoint la Linguistique Variationniste, définie par Labov comme des « façons alternatives de dire la même chose » (Labov 1972, trad. de l'auteur), qui postule une variation systématiquement motivée (Bresnan et al. 2007 ; De Vaere et al. 2021 ; Szmrecsanyi et al. 2016). L'Alternance Tough apparaît ainsi ni libre ni aléatoire, mais structurée et analysable. Dès lors, le projet hypothètise que (i) les deux variantes sont motivées par des facteurs linguistiques et extra-linguistiques et que (ii) elles ne sont, en principe, pas interchangeables, induisant des interprétations distinctes, conformément au Principe de Non-Équivalence (Goldberg 1995 ; Leclercq & Morin 2023). Les facteurs considérés comprennent les propriétés syntaxiques, sémantiques, pragmatiques et lexicales des constructions (e.g. imbrication, temporalité), ainsi que des éléments qui y figurent (e.g. longueur de l'argument, animacité, statut discursif, degré d'idiomatisation), le tout étant influencé par le contexte lectal (e.g. registre, canal, variables sociodémographiques). Les données seront codées selon cette série de variables (extra-)linguistiques, puis analysées au moyen de forêts aléatoires conditionnelles pour l'établissement d'un modèle probabiliste, et de régressions logistiques à effets mixtes afin d'explorer les interactions entre facteurs. En définitive, l'originalité de ce projet réside dans la combinaison d'une approche empirique quantitative et d'une réflexion théorique renouvelée d'un objet d'étude classique. Il vise à construire un modèle prédictif de l'usage de l'Alternance Tough en anglais et, le cas échéant, à réévaluer certains postulats théoriques à partir de données attestées. En intégrant des facteurs souvent négligés, il contribue à une conception probabiliste de la grammaire, où les choix syntaxiques sont motivés, structurés et révélateurs du fonctionnement cognitif et social du langage.