Thèse soutenue

Étude empirique de la recherche d'informations dans les publications scientifiques pour des applications d'intégration de connaissances en monde réel

FR  |  
EN
Auteur / Autrice : Chyrine Tahri
Direction : Xavier TannierPatrick Haouat
Type : Thèse de doctorat
Discipline(s) : Science des données
Date : Soutenance le 25/09/2023
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Pierre Louis de santé publique : épidémiologie et sciences de l'information biomédicale (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique médicale et d'ingénierie des connaissances en e-santé (Paris ; 2014-....)
Jury : Président / Présidente : Christophe Marsala
Examinateurs / Examinatrices : Davide Buscaldi
Rapporteurs / Rapporteuses : Elisabeth Murisasco, Alice Oh

Résumé

FR  |  
EN

Cette thèse tourne autour de l'intégration des technologies de traitement automatique du langage naturel (TALN) dans le conseil en innovation, explorant les complexités, les défis et les stratégies qui rendent cette intégration à la fois fluide et efficace. Alors que les économies basées sur la connaissance prospèrent, les consultants en innovation aident les entreprises à exploiter la connaissance et l'innovation pour obtenir des avantages concurrentiels. Le TALN, avec ses capacités puissantes, ouvre de nouvelles avenues pour de telles entreprises de conseil, leur permettant de traiter, d'analyser et de tirer parti de vastes quantités de données non structurées - comme des articles scientifiques et des brevets - afin de renforcer les stratégies d'innovation et de croissance de leurs clients. L'exploration menée tourne autour de plusieurs questions clés. Tout d'abord, elle plonge dans la faisabilité d'intégrer de manière transparente les technologies de TALN dans les flux de travail existants en recherche, développement et innovation. Cette démarche vise à obtenir une intégration intuitive qui améliore fondamentalement la productivité. En se basant sur des fonctionnalités telles que la recherche de documents et la réponse aux questions dans l'expertise existante de l'entreprise, nous cherchons à découvrir des stratégies pratiques pour surmonter les obstacles à l'intégration. Ensuite, l'étude aborde l'interaction complexe des facteurs influençant l'adoption réussie des systèmes de TALN dans le paysage industriel. Elle prend en compte des obstacles tels que l'accessibilité aux données, la quantité et les contraintes liées aux ressources. Cette exploration dévoile une multitude de problèmes, notamment la tâche complexe de modélisation des problèmes du monde réel, la nécessité de transparence et de confiance dans les processus prédictifs, ainsi que l'obligation d'aligner les mesures de performance sur les exigences spécifiques des applications concrètes. Enfin, la thèse se penche sur l'évaluation des systèmes de TALN dans des contextes industriels réels. Cela implique d'examiner comment les modèles se comportent par rapport aux benchmarks et, plus essentiellement, comment cette performance se traduit dans des scénarios concrets. L'enquête prend forme à travers une analyse pratique d'un cas annoté par des consultants en innovation. Cette analyse révèle des écarts potentiels entre les évaluations de référence et l'efficacité réelle des modèles de TALN dans des contextes concrets, soulignant la nature subjective de la pertinence et sa dépendance profonde aux facteurs contextuels. Les variations dans la manière dont les modèles réagissent à différents sujets influencent considérablement les résultats lors de la recherche d'informations.