Thèse soutenue

Évaluation de la qualité des contributions et des contributeurs sur plateformes de crowdsourcing

FR  |  
EN
Auteur / Autrice : Constance Thierry
Direction : Arnaud Martin
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 14/12/2021
Etablissement(s) : Rennes 1
Ecole(s) doctorale(s) : MATHSTIC
Partenaire(s) de recherche : Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - DRUID
Equipe de recherche : DRUID
Jury : Président / Présidente : Éric Lefèvre
Examinateurs / Examinatrices : Jean-Christophe Dubois, Yolande Le Gall
Rapporteurs / Rapporteuses : Allel Hadjali, Sihem Amer-Yahia

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Le crowdsourcing est l'externalisation de tâches à une foule de contributeurs sur des plateformes dédiées. Les tâches sont simples et accessibles à tous, c'est pourquoi la foule est constituée de profils très diversifiés, ce qui induit des contributions de qualité inégales. La méthode d'agrégation la plus employée dans les plateformes ne prend pas en considération les imperfections des données relatives aux contributions humaines ce qui impacte les résultats obtenus. L'ensemble des travaux de cette thèse tend à solutionner la problématique de la qualité des données de crowdsourcing. Nous proposons ainsi une nouvelle interface pour le crowdsourcing offrant davantage de capacité d'expression au contributeur. Les expériences menées nous ont permis de mettre en évidence une corrélation entre la difficulté de la tâche, la certitude du contributeur et l'imprécision de sa réponse. Nous avons également validé l'hypothèse de Ph. Smets d'après laquelle plus une personne est imprécise plus elle est certaine et réciproquement plus elle est précise moins elle est certaine. Une fois cette hypothèse validée, nous avons élaboré le modèle MONITOR pour l'estimation du profil du contributeur et l'agrégation des réponses grâce à la théorie des fonctions de croyance qui permet de modéliser les imperfections. L'intégralité de nos expérimentations est réalisée sur des données réelles provenant de campagnes de crowdsourcing.