Exploitation automatique d'une base de données d'images à partir des informations textuelles jointes sur des bases cognitives

par Pascale Etchebès

Thèse de doctorat en Sciences du langage. Traitement automatisé du langage

Sous la direction de Henri Madec.


  • Résumé

    Notre sujet de recherche s'inspire de notre pratique professionnelle dans la constitution de bases de données d'images industrielles. Nous avons mené une mission d'automatisation d'une partie du fonds photographique des Chantiers de l'Atlantique à Saint-Nazaire. C'est à partir de cette expérience professionnelle que nous avons bâti notre projet. La photo industrielle montre les limites de l'approche habituelle de description qui consiste à lister les mots comme si le mot et sa trace écrite étaient liés à un référent stable et constitué. Notre conception du TAL nous conduit au-delà des mots, des termes et du langage. Notre approche est essentiellement conceptuelle. Le concept renvoie à la construction de la référence qui accompagne le mot : l'objet, l'action, la technologie, le sentiment, et ce à une époque donnée (l'univers de la construction navale peut avoir considérablement évolué de même que le sens des mots). Notre thèse consiste à proposer les principes de constitution d'une ontologie industrielle avec ses domaines, ses limites, ses activités, ses agents, ses produits, en tenant compte du fait que nous travaillons sur un média qui est la photo et qui justifie une rupture d'avec les solutions logicielles et documentaires proposées jusqu'à présent et qui ne prenaient en compte que du texte. Le travail est faiblement lexicologique ou terminologique. Ce n'est pas que le traitement linguistique est exclu de notre démarche. Le problème se posera avec acuité lorsqu'on se situera dans les interfaces en langage naturel.

  • Titre traduit

    Automatic exploitation of an image databasis from textual information joined on cognitive bases


  • Résumé

    Our project of study is inspired from our profesional experience in the setting up of industrial images databases. We conducted a mission of computerization of a part of the photographic collection of the Chantiers de l'Atlantique in Saint-Nazaire (France). From this professional experience we drawn up our project. The industrial photography shows the limits of the usual approach of description which consists in listing the words as if the word and its written mark were linked up with a stable and constituted referent. Our conception of NLP technologies leads us beyond words, terms and language. Our approach is essentially conceptual. The concept refers to the construction of the reference which goes with the word : the object, the action, the technology, the feeling, and this at a given period (the universe of shipbuilding may have considerably evolved as well as the sense of the words). Our thesis consists in proposing the principles of setting up of an industrial ontology, its areas, its limits, its activities, its agents, its products, taking into account the fact that we are working on a media which is image and which justifies a break with software and information solutions proposed up to now and which only took into account the text. The work is faintly lexicologic or terminologic. It is not that linguistic data processing is dismissed of our process. The problem will be deeply questioned when we will find ourselves in natural language interfaces. Our thesis is composed of five parts. It is illustrated by photographies from the Chantiers de l'Atlantique, which have been chosen for their explicative power

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 2 vol. (401, [19] f. de pl., [233] f.)
  • Notes : Reproduction autorisée par le Jury
  • Annexes : Bibliogr. p. 357-394. Index

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Bibliothèque universitaire. Section Lettres.
  • Disponible pour le PEB
  • Cote : 219400.1
  • Bibliothèque : Bibliothèque universitaire. Section Lettres.
  • Disponible pour le PEB
  • Cote : 219401.2
  • Bibliothèque : Université de Nantes. Service commun de la documentation. BU Droit.
  • Disponible pour le PEB

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2003BESA1019
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.