Age, gender, fuck, and twitter : a sociolinguistic analysis of swearing in a corpus of British tweets

par Michaël Gauthier

Thèse de doctorat en Etudes anglophones Sociolinguistique

Sous la direction de Jim Walker et de Kristy Beers Fägersten.

Soutenue le 30-09-2017

à Lyon , dans le cadre de École doctorale Lettres, langues, linguistique, arts (Lyon) , en partenariat avec Centre de recherches en terminologie et traduction (Bron, Rhône) (laboratoire) , Université Lumière (Lyon) (établissement opérateur d'inscription) et de Centre de recherche en terminologie et traduction / CRTT (laboratoire) .

Le président du jury était Tony McEnery.

Le jury était composé de Vaclav Brezina, Céline Poudat.

Les rapporteurs étaient Andrea Pizarro Pedraza.

  • Titre traduit

    Age, genre, fuck et Twitter : une analyse sociolinguistique des jurons dans un corpus de tweets britanniques


  • Résumé

    Parmi les traits traditionnellement associés au genre d’une personne, la manière dont les individus utilisent le langage est un facteur tout aussi important que d’autres aspects, potentiellement plus évidents, tels que la manière de s’habiller par exemple. La littérature recense de nombreux traits linguistiques faisant partie de ces idées associées à un genre ou l’autre tels que la tournure interrogative (tag question) ou la déférence par exemple. De toutes les caractéristiques linguistiques genrées, celle qui a probablement été le plus débattue est celle concernant l’utilisation des jurons. Ceci est principalement dû à des idées qui ont longtemps été associées à l’utilisation de la vulgarité : celles d’un langage « impur », blasphématoire ou encore d’un langage tabou. A cause d’une interaction complexe entre pression et pouvoir social, la vulgarité a traditionnellement été associée à l’idée de masculinité avant tout. Utiliser des jurons est souvent considéré comme étant l’affirmation linguistique d’une forme de pouvoir social. Par conséquent, l’association intrinsèque de la vulgarité comme forme de pouvoir à un genre ou l’autre pourrait conduire à l’association d’autres caractéristiques sociales aux questions de masculinité ou de féminité, qu’elles soient fondées ou non. Certaines études ont démontré que, contrairement aux idées longtemps répandues, les femmes n’utilisent pas la vulgarité moins souvent que les hommes, pas plus qu’elles n’utilisent un registre linguistique fondamentalement différent. Certaines ont même prédit que l’utilisation de jurons dits « forts » (i.e. « strong swear words ») chez les femmes augmenterait dans certains contextes, et en particulier sur les réseaux sociaux (Thelwall, 2008) ; ceci s’appliquerait particulièrement aux jeunes générations de femmes. En d’autres termes, l’utilisation de certains jurons chez ces jeunes générations de femmes deviendrait à terme plus fréquente que celle des hommes du même âge. Cette hypothèse correspond à certains travaux qui suggèrent que la communication assistée par ordinateur participe à l’autonomisation des femmes. Il serait donc intéressant de vérifier ces observations et prédictions près de dix ans après qu’elles aient été formulées afin de les confirmer ou de les réfuter. Par conséquent, la question suivante se pose : les prévisions faites par Thelwall en 2008 se sont-elles réalisées près de dix ans plus tard, dans une société où les médias sociaux n’ont jamais eu autant d’importance dans notre vie quotidienne ? Le but de cette thèse est donc double : tout d’abord elle vise à offrir une meilleure compréhension de la manière dont les femmes et les hommes utilisent la vulgarité sur les réseaux sociaux. Le second objectif de ce travail est de démontrer le potentiel de ce type de médias en tant qu’objet d’étude sociolinguistique synchronique (et potentiellement diachronique) de grande échelle.Cette étude est basée sur un corpus composé d’un peu plus de dix-huit millions de tweets représentatifs de près de 739 000 utilisateurs. Le corpus a été constitué à partir de tweets provenant du Royaume Unis, émis par des utilisateurs masculins et féminins, et appartenant à différentes tranches d’âge. Une méthodologie et des outils d’analyse issus de la linguistique dite de corpus ont été utilisés pour mener à bien ce projet et tenter de répondre aux problématiques soulevées précédemment. Aussi, en raison du manque d’informations démographiques directement associées aux profils Twitter (e.g. le genre et l’âge des utilisateurs), il fût nécessaire de recourir à des techniques issues de la programmation informatique afin d’inférer le genre et l’âge de ces personnes. Cette thèse entend donc améliorer les connaissances que nous avons du lien qu’il existe entre le genre, l’âge, l’utilisation de la vulgarité et les réseaux sociaux.


  • Résumé

    Gender norms pervade many layers of our society, and more or less strongly influence the expectations we may have of others. Among these pre-conceptions, many linguistic patterns have been said to be representative of male or female features, like tag questions, deference, turn-taking for example. Of all the gendered linguistic characteristics, the one which may have been the most debated is that of swear words. Swearing is indeed a subject which, even when gender is not concerned, generally provokes many tensions and debates. This is partly due to what swear words are often associated to, that is, what is called “bad language”. Because of a complex interplay between social expectations and power relations, swearing has traditionally been associated with men. These kinds of association led to the creation of pre-conceived ideas stigmatizing women and men who would use a linguistic feature not generally associated with them. These preconceived ideas also fuel societal stereotypes and may impact people’s standards concerning what is desirable from each gender. Moreover, swearing is often considered as an act of power and a way of affirming oneself. Thus, the fact that one gender may be perceived as more frequent users of swear words, or on the other hand as swear word eschewers, may have an impact on other qualities related to power that we would inherently attribute to one gender or the other, whether these differences are real or not. Some studies have showed that contrary to what has long been widely believed, women do not swear less frequently than men, nor do they use a drastically different register. Some even envisioned that the use of “strong” swear words by women would increase in certain contexts, specifically on social media; this seemed especially true for younger generations of users. It was even predicted that “gender equality in swearing or a reversal in gender patterns for strong swearing, will slowly become more widespread, at least in social network sites” (Thelwall, 2008: 102), such that the use of strong swear words among young women will eventually be more frequent than among (young) men. Accordingly, the swearing patterns displayed in 2008 could keep evolving for a certain category of women (especially younger ones), which would correlate with other claims, which stated that computer-mediated communication as a whole could be empowering for women. Thus, the following question arises: has the prediction made by Thelwall in 2008 been fulfilled eight years later, in a society where computer-mediated communication in the context of social media is firmly rooted in people's everyday lives? The aim of this thesis is thus twofold: first, it is to offer a better understanding of the patterns of swear word usage among women and men on social media, and second, it is to show the potential of these media as a source of data for synchronic (and possibly diachronic) sociolinguistic studies on a much larger scale. This study is based specifically on a corpus composed of just over eighteen million tweets issued by roughly 739 000 users. The corpus was populated with tweets by British users of both genders and from different age groups throughout the United Kingdom. Corpus linguistic methodology and tools have been used to address the sociolinguistic issues raised earlier. Also, because Twitter does not provide us with a direct access to the gender or the age of the users, using computer-programming methods has been necessary to be able to study these age and gender differences.This thesis hopes to advance the field of swearing research with regards both to gender and the relatively new context of social media. In so doing, it also aims to further establish the use of social media in linguistic investigation and pave the way for future studies.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Lumière (Bron). Service commun de la documentation. Bibliothèque universitaire.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.