Thèse soutenue

Étude des glissements de sens induits par le contact de langues en anglais québécois : apports conjoints de la modélisation vectorielle sur corpus et de l'approche sociolinguistique variationniste

FR  |  
EN
Auteur / Autrice : Filip Miletic
Direction : Anne PrzewoznyLudovic Tanguy
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 20/06/2022
Etablissement(s) : Toulouse 2
Ecole(s) doctorale(s) : École doctorale Comportement, Langage, Éducation, Socialisation, Cognition (Toulouse)
Partenaire(s) de recherche : Laboratoire : Cognition, langues, langage, ergonomie (Toulouse ; 2006-....)
Jury : Président / Présidente : Sabine Schulte im Walde
Examinateurs / Examinatrices : Amélie Josselin-Leray, Kris Heylen
Rapporteur / Rapporteuse : Sabine Schulte im Walde, Stefan Dollinger

Résumé

FR  |  
EN

Cette thèse étudie les glissements de sens induits par le contact de langues en anglais québécois, à savoir des mots anglais préexistants utilisés avec un sens différent en raison d’une influence potentielle du français. Nous proposons une approche novatrice à l’intersection du traitement automatique des langues et de la sociolinguistique variationniste, afin de fournir une description exhaustive de ce phénomène ainsi que d’évaluer les contributions des approches sur corpus mises en œuvre ici.Afin d’effectuer des analyses computationnelles de variation sémantique, nous avons constitué un corpus composé de 78,8 millions de tweets de Montréal, Toronto et Vancouver. Le corpus a été utilisé pour mettre en œuvre différents types de modèles vectoriels, à savoir des représentations computationnelles du sens des mots. Les modèles statiques ont permis d’identifier de nouveaux glissements de sens, alors que les modèles contextuels ont permis de caractériser plus finement leurs utilisations. Malgré des résultats prometteurs, ces méthodes sont limitées par le bruit lié à leurs caractéristiques intrinsèques et à la structure du corpus.Ces approches ont été complétées par des données plus fines recueillies au moyen d’entretiens sociolinguistiques avec 15 locuteurs vivant à Montréal. Les corrélations entre les variables linguistiques et différents facteurs sociodémographiques, ainsi que les remarques qualitatives sur leur utilisation, indiquent quatre patterns de variation synchronique ; ceux-ci pourraient à leur tour refléter des processus diachroniques. Par ailleurs, la variabilité inter-locuteurs suggère un rôle important des locuteurs bilingues et plus jeunes dans l'utilisation des glissements de sens. Enfin, les scores d'acceptabilité sont faiblement corrélés avec les mesures computationnelles, ce qui suggère que ceux-ci reflètent d’autres dimensions de variation sémantique.Dans l'ensemble, cette thèse a fourni la première description systématique des glissements de sens en anglais québécois. Elle a également mis en évidence la complémentarité des approches développées dans des disciplines différentes. Ces considérations ouvrent la voie à une utilisation plus avisée des méthodes computationnelles basées sur corpus dans des études de phénomènes sociolinguistiques.