Thèse soutenue

L'évaluation de la méthode du crowdsourcing pour la transcription de manuscrits.

FR  |  
EN
Auteur / Autrice : Anne Vikhrova
Direction : Thomas Lebarbé
Type : Thèse de doctorat
Discipline(s) : Sciences du langage Spécialité Informatique et sciences du langage
Date : Soutenance le 06/12/2017
Etablissement(s) : Université Grenoble Alpes (ComUE)
Ecole(s) doctorale(s) : École doctorale langues, littératures et sciences humaines (Grenoble ; 1991-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire de linguistique et didactique des langues étrangères et maternelles (Grenoble)
Jury : Président / Présidente : Claire Doquet-Lacoste
Examinateurs / Examinatrices : Michel Bernard
Rapporteurs / Rapporteuses : Emmanuelle de Champs, Marcello Vitali-Rosati

Résumé

FR  |  
EN

Les projets en humanités numériques utilisent de plus en plus des méthodes de collaboration axées sur le public, telles que le crowdsourcing pour atteindre les objectifs de recherche, de conservation et d’édition scientifique en sciences humaines et sociales. Par exemple, le crowdsourcing représente une opportunité pour accélérer les projets de transcription pour des communautés de chercheurs qui travaillent traditionnellement dans des circuits-fermés. Certaines questions importantes soulevée par les chercheurs et les érudits concernent notamment l’intérêt de la méthode, et en particulier la qualité des résultats obtenus avec cette méthode. En outre, l’efficacité du crowdsourcing pour les humanités numériques n’est pas documenté dans la littérature. Se pose ainsi la question de savoir si le public peut produire du matériel pouvant être par la suite utilisé pour des éditions scientifiques, auxquels cas, pour quel type de projet et combien de post-traitement ou corrections seront nécessaires.Cette thèse de doctorat examinera le potentiel apport du crowdsourcing des transcriptions pour les projets d’édition scientifique en humanités numériques. Pour cela, nous allons premièrement explorer les technologies et les techniques disponibles pour produire les transcriptions sous format XML en ligne. Deuxièmement, ayant développé et testé une plateforme internet de transcription que nous présenterons, nous pourrons examiner les besoins des utilisateurs vis-à-vis des environnements de travail collaboratifs fondées sur les retours des utilisateurs et les environments de crowdsourcing industriels existants. Troisièmement, les données récoltées seront soumises à une analyse numérique qui permettra de comparer les productions des experts et celle des non-experts en s’appuyant sur les mesures de distances entre documents. Les résultats obtenus permettront de déterminer le potentiel apport du crowdsourcing pour les projets d’édition numérique scientifique. Enfin, le travail se terminera avec une discussion sur les implications des travaux actuels et présentera des opportunités pour des recherches futures sur le terrain.