Thèse soutenue

Alchimie et ordinateur : une analyse computationnelle du corpus jābirien

FR  |  
EN
Auteur / Autrice : Ilaria Cicola
Direction : Pierre LoryGiuliano Lancioni
Type : Thèse de doctorat
Discipline(s) : Religions et systèmes de pensée
Date : Soutenance le 17/10/2016
Etablissement(s) : Paris, EPHE en cotutelle avec Università degli studi La Sapienza (Rome)
Ecole(s) doctorale(s) : École doctorale de l'École pratique des hautes études (Paris)
Partenaire(s) de recherche : Laboratoire : LEM Laboratoire d’études sur les Monothéismes (Paris ; 1998-....)
Jury : Président / Présidente : Pascal Crozet
Examinateurs / Examinatrices : Pierre Lory, Giuliano Lancioni, Pascal Crozet, Antonella Ghersetti, Monica Ruocco
Rapporteurs / Rapporteuses : Denis Gril, Éric Geoffroy

Résumé

FR  |  
EN

Cet élaborât veut donner un nouvel approche à l’étude du corpus jābirien, en prenant compte de la littérature et des études précédents et des problématiques inhérentes à ce particulier corpus (synonymie, polysémie, dispersion du savoir, citations d’autres auteurs, hypertextualité). Grace aux nouvelles technologies d’analyse computationnelle ce travail vise à la digitalisation de textes édités (Muḫtār Rasāʾil, Tabdīr al-iksīr al-aʿẓam, Kitāb al- ahjār), pour créer un corpus numérique annoté selon le Text Encoding Initiative (TEI), le système d’annotation le plus utilisé dans le Natural Language Processing (NLP). La première section de la thèse comprend une introduction historique, prenant compte de la figure de Jābir et de son travail, de la querelle sur son existence et de l’histoire de la science Arabe médiévale ; et méthodologique, qui explique les outils utilisés pour l’analyse. La deuxième section est opérationnelle : le travail est expliqué dans tous ses détails et où les choix de numérisation et analyse sont exposés. Les problématiques présentées dans la première section trouvent ici des réponses pour ce qui concerne leur analyse. Le noyau de ce travail est représenté cependant par les Appendices, divisées en quatre parties : Les Appendices A, B et C sont des extraits bruts de la numérisation, qui donnent une idée du processus d’annotation selon le standard TEI. Les trois textes édités sont représentés par le premier livre de l’édition. L’Appendice D est un échantillon de concordances qui se base sur la lemmatisation des deux premiers livres du Tadbīr. L’Appendice E est une liste de fréquence du même échantillon utilisé pour la création des concordances.