Thèse soutenue

Étude des conflits dans l'édition collaborative

FR  |  
EN
Auteur / Autrice : Hoai Le Nguyen
Direction : François CharoyClaudia-Lavinia Ignat
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 14/01/2021
Etablissement(s) : Université de Lorraine
Ecole(s) doctorale(s) : École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine
Partenaire(s) de recherche : Laboratoire : Laboratoire lorrain de recherche en informatique et ses applications
Jury : Président / Présidente : Horatiu Cirstea
Examinateurs / Examinatrices : François Charoy, Claudia-Lavinia Ignat, Sophie Chabridon, Stefano Zacchiroli, Hala Skaf
Rapporteurs / Rapporteuses : Sophie Chabridon, Stefano Zacchiroli

Résumé

FR  |  
EN

L’édition collaborative (EC) a depuis longtemps attiré l’attention des chercheurs du Computer- supported-cooperative work (CSCW). Les premières recherches sur l’EC (dans les années 1990 et au début de 2000) se concentrent sur la description des différentes caractéristiques d’EC sur la base d’interviews de personnes qui avaient participé à certains projets d’EC. Certaines recherches récentes sur CE commencent à analyser les journaux des activités CE pour étudier comment les gens éditent ensemble avec le support des outils CE modernes tels que les systèmes de contrôle de version Git et Google Docs.D’un point de vue général, le processus d’EC est la synchronisation continue de ‘multiples, parallèles flux d’activités’ de collaborateurs. Si la synchronisation a lieu moins souvent, par exemple le développement d’un projet logiciel basé sur le système de contrôle de version Git, il est considéré comme un mode de travail ‘asynchronous’. Et si la synchronisation a lieu dans un petit intervalle, par exemple en éditant un document partagé dans ShareLaTex, il est considéré comme un mode de travail ‘synchronous’. Plus la divergence est longue, plus le conflit est susceptible de se produire pendant la synchronisation. La résolution des conflits coûte cher, surtout après une longue période de divergence. Il est important de comprendre la fréquence des conflits et la manière dont les utilisateurs résolvent les conflits dans de vrais projets CE pour garantir de bonnes performances et une expérience utilisateur dans l’édition collaborative. Dans la première partie de cette thèse, nous empruntons les traces de collaboration de quatre grands projets open source dans le système de contrôle de version Git pour mener notre analyse. Nous analysons différents types de conflits textuels qui surviennent au cours du développement et comment les développeurs résolvent ces types de conflits. En particulier concernant les ‘adjacent-line conflict’, nous avons constaté que les utilisateurs les résolvent principalement en appliquant les modifications des deux sites. En outre, nous analysons également la fréquence à laquelle les utilisateurs utilisent le ‘roll-back to previous version’ pour résoudre les conflits de fusion. Le processus de CE basé sur l’éditeur collaboratif en ligne est plus spécifique. Il peut être divisé en plusieurs ‘sessions’ d’édition qui sont effectuées par un seul auteur ou plusieurs auteurs. Ils sont notés respectivement ‘single-authored session’ et ‘co-authored session’. Ce processus de fragmentation nécessite un ‘intervalle’ ou ‘intervalle de temps maximal’ prédéfini qui n’est pas encore bien défini dans les études précédentes. Dans la deuxième partie de cette thèse, nous analysons les journaux des travaux CE d’un étudiant d’une école d’ingénieurs utilisant ShareLaTeX qui ont été collectés et anonymisés à des fins de confidentialité. En examinant différents ‘maximum time gap’ de 30 secondes à 15 minutes sur les journaux, nous avons constaté que nous pouvons déterminer un ‘maximum time gap’ approprié pour diviser les activités d’EC en sessions en évaluant la distribution de la ‘external-distance’. De plus, nous avons analysé les activités d’édition au sein de chaque ‘co-author session’. Nous empruntons une fenêtre de position temporelle de [30 secondes, 10 caractères] pour examiner ces cas de ‘potential conflict’. Le résultat montre que les gens éditent rarement de près dans les deux positions temporelles. Cependant, les conflits sont plus susceptibles de se produire dans ces cas.