Modélisation d'une terminologie médicale en langue arabe à des fins de médiation, d'extraction et de recherche d'information

par Khadija El Bouchikhi

Thèse de doctorat en Sciences de l'information et de la communication

Sous la direction de Widad Mustafa El Hadi.

Soutenue en 2011

à Lille 3 .


  • Résumé

    Notre objectif, dans le cadre de ce projet de thèse, est la proposition d'un modèle terminologique à des fins d'extraction, de recherche d'information et de médiation dans un contexte multilingue. Le contexte multilingue a été choisi pour répondre aux besoins des utilisateurs dans la diffusion et la structuration de l'information spécialisée dans le domaine médical en langue arabe. Etant donnée la difficulté de traitement automatique de la terminologie médicale en langue arabe morphologiquement et/ou sémantiquement, nous avons voulu aborder ces problématiques en nous appuyant sur ce qui était déjà fait en Anglais, une autre langue qui connaît des avancées en TALN. Nous nous sommes focalisés sur le champ sémantique et pour ce faire, nous nous sommes appuyés sur la catégorisation sémantique internationale de l'UMLS. L'idée principale du projet est de refléter l'importance du rôle de l'outil terminologique dans les recherches en sciences de l'information et de la communication qui accorde plus d'importance à l'outil thésaurique qu'à l'outil terminologique au niveau de la structuration de l'information. Les résultats de notre expérience ont été satisfaisants étant donné les difficultés rencontrées au cours de l'évolution de notre projet. Ces difficultés étaient liées au manque de la documentation spécialisée en langue arabe, et d'outils permettant à la terminologie de s'appliquer dans le contexte d'un SRI. Nous avons constitué quelques échantillons de ces outils afin de consolider notre idée sur le plan pratique. Nos résultats ont été concrétisés par la proposition de deux méthodologies au niveau de la recherche de l'information, i) une méthodologie de reformulation des requêtes et ii) une autre en structuration de l'information au niveau de l'indexation. Et d'autres prometteuses, au niveau de l'acquisition des connaissances, nous avons exploré l'alignement phrastique pour but d'extraction des termes médicaux en langue arabe, et nous avons suggéré de considérer l'outil terminologique comme élément de médiation afin d'améliorer la communication spécialisée. Nous avons ainsi constaté à travers l'évolution de notre projet le rôle primordial de l'outil terminologique pour l'amélioration des recherches documentaires spécialisées en langue arabe et de façon générale, son rôle important dans le traitement de l'information dans le domaine médical

  • Titre traduit

    Medical terminology model in Arabic for the mediation, extraction and search information


  • Résumé

    The objective of our thesis is the proposal of a terminological model for the mediation, extraction and search information in multilingual context. The multilingual context was chosen to serve the needs of the users in the structuring and diffusion of specialized information in Arabic language. Given the difficulty of the automatic treatment of Arabic language in specialized domain, morphologically and semantically we have used existing NLP advanced developed in English language. We focused on semantic field, so we have used the semantic categorisation of UMLS. The main idea of the project is to reflect the importance of the role of terminology in the researches in information and communication sciences, which give more importance to the thesaurus than to the terminology in information structuring. The results of our project were satisfactory given the difficulties encountered and overcome throughout the course of our project. These difficulties were linked to the absence of medical documentation in Arabic language and of the tools, whic allow applying the terminology in the context of a SRI. Our work resulted in the proposition of main two methodologies at the level of the research i) a methodology of reformulation of the requests and ii) the other one in a methodology of indexation. We also developed others promising methodology in the field of the acquisition of knowledge, we investigated the field of the alignment for the purpose of extraction of medical terms in Arabic language. At the end in our project, we suggested to consider the terminology as element of mediation to improve specialized communication. Throughout the evolution of our project, we observed the essential role of terminology in the improvment of specialized retrieval systems in Arabic language and generally its important role in the treatment of information in the medical field

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (236 f.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. f. 199-224. Webogr. f. 224-230

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 50.377-2011-38

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2011LIL30038
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.