Modeling the socio-semantic dynamics of scientific communities

par Elisa Omodei

Thèse de doctorat en Mathématiques appliquées aux sciences sociales

Sous la direction de Thierry Poibeau.

Soutenue le 19-12-2014

à Paris, Ecole normale supérieure , dans le cadre de École doctorale École transdisciplinaire Lettres/Sciences (Paris) , en partenariat avec Langues, textes, traitements informatiques, cognition (Montrouge, Hauts de Seine) (laboratoire) , Langues- textes- traitement informatique- cognition / LaTTice (laboratoire) et de Langues- textes- traitement informatique- cognition / LaTTice (laboratoire) .

  • Titre traduit

    Modélisation des dynamiques socio-sémantiques dans les communautés scientifiques


  • Résumé

    Comment les structures sociales et sémantiques d'une communauté scientifique guident-elles les dynamiques de collaboration à venir ? Dans cette thèse, nous combinons des techniques de traitement automatique des langues et des méthodes provenant de l'analyse de réseaux complexes pour analyser une base de données de publications scientifiques dans le domaine de la linguistique computationnelle : l'ACL Anthology. Notre objectif est de comprendre le rôle des collaborations entre les chercheurs dans la construction du paysage sémantique du domaine, et, symétriquement, de saisir combien ce même paysage influence les trajectoires individuelles des chercheurs et leurs interactions. Nous employons des outils d’analyse du contenu textuel pour extraire des textes des publications les termes correspondant à des concepts scientifiques. Ces termes sont ensuite connectés aux chercheurs pour former un réseau socio-sémantique, dont nous modélisons la dynamique à différentes échelles. Nous construisons d’abord un modèle statistique, à base de régressions logistiques multivariées, qui permet de quantifier le rôle respectif des propriétés sociales et sémantiques de la communauté sur la dynamique microscopique du réseau socio-sémantique. Nous reconstruisons par la suite l’évolution du champ de la linguistique computationelle en créant différentes cartographies du réseau sémantique, représentant les connaissances produites dans le domaine, mais aussi le flux d’auteurs entre les différents champs de recherche du domaine. En résumé, nos travaux ont montré que la combinaison des méthodes issues du traitement automatique des langues et de l'analyse des réseaux complexes permet d'étudier d'une manière nouvelle l'évolution des domaines scientifiques.


  • Résumé

    How are the social and semantic structures of a scientific communitydriving future research dynamics? In this thesis we combine naturallanguage processing techniques and network theory methods to analyzeavery large dataset of scientific publications in the field of computationallinguistics,i.e.the ACL Anthology. Ultimately, our goal is to understandthe role of collaborations among researchers in building and shaping thelandscape of scientific knowledge, and, symmetrically, to understand howthe configuration of this landscape influences individual trajectories ofresearchers and their interactions. We use natural language processingtools to extract the terms corresponding to scientific concepts from thetexts of the publications. Then we reconstruct a socio-semantic networkconnecting researchers and scientific concepts, and model the dynamicsof its evolution at different scales. To achieve this, we first build astatistical model, based on multivariate logistic regression, that quantifiesthe role that social and semantic features play in the evolution of thesocio-semantic network, namely in the emergence of new links. Then, wereconstruct the evolution of the field through different visualizations of theknowledge produced therein, and of the flow of researchers across thedifferent subfields of the domain. To summarize, we have shown throughour work that the combination of natural language processing techniqueswith complex network analysis makes it possible to investigate in a novelway the evolution of scientific fields.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Ecole normale supérieure. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.