Thèse soutenue

Modélisation des dynamiques socio-sémantiques dans les communautés scientifiques

FR  |  
EN
Auteur / Autrice : Elisa Omodei
Direction : Thierry Poibeau
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées aux sciences sociales
Date : Soutenance le 19/12/2014
Etablissement(s) : Paris, Ecole normale supérieure
Ecole(s) doctorale(s) : École doctorale Lettres, Arts, Sciences humaines et sociales (Paris ; 2010-....)
Partenaire(s) de recherche : Laboratoire : Langues, textes, traitements informatiques, cognition (Montrouge, Hauts de Seine) - Langues- textes- traitement informatique- cognition / LaTTice - Langues- textes- traitement informatique- cognition / LaTTice

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Comment les structures sociales et sémantiques d'une communauté scientifique guident-elles les dynamiques de collaboration à venir ? Dans cette thèse, nous combinons des techniques de traitement automatique des langues et des méthodes provenant de l'analyse de réseaux complexes pour analyser une base de données de publications scientifiques dans le domaine de la linguistique computationnelle : l'ACL Anthology. Notre objectif est de comprendre le rôle des collaborations entre les chercheurs dans la construction du paysage sémantique du domaine, et, symétriquement, de saisir combien ce même paysage influence les trajectoires individuelles des chercheurs et leurs interactions. Nous employons des outils d’analyse du contenu textuel pour extraire des textes des publications les termes correspondant à des concepts scientifiques. Ces termes sont ensuite connectés aux chercheurs pour former un réseau socio-sémantique, dont nous modélisons la dynamique à différentes échelles. Nous construisons d’abord un modèle statistique, à base de régressions logistiques multivariées, qui permet de quantifier le rôle respectif des propriétés sociales et sémantiques de la communauté sur la dynamique microscopique du réseau socio-sémantique. Nous reconstruisons par la suite l’évolution du champ de la linguistique computationelle en créant différentes cartographies du réseau sémantique, représentant les connaissances produites dans le domaine, mais aussi le flux d’auteurs entre les différents champs de recherche du domaine. En résumé, nos travaux ont montré que la combinaison des méthodes issues du traitement automatique des langues et de l'analyse des réseaux complexes permet d'étudier d'une manière nouvelle l'évolution des domaines scientifiques.