Un prisme sémantique des brevets par thésaurus interposés : positionnement, essais et applications
Auteur / Autrice : | Nezha Cherrabi El Alaoui |
Direction : | Jean-Max Noyer, David Reymond |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences de l'information et de la communication |
Date : | Soutenance le 11/12/2020 |
Etablissement(s) : | Toulon |
Ecole(s) doctorale(s) : | École doctorale Sociétés méditerranéennes et sciences humaines (Toulon ; 2008-....) |
Partenaire(s) de recherche : | Laboratoire : Institut Méditerranéen des Sciences de l'Information et de la Communication (Toulon ; Marseille ; 2018-....) |
Jury : | Président / Présidente : Laurence Favier |
Examinateurs / Examinatrices : Chérifa Boukacem-Zeghmouri | |
Rapporteurs / Rapporteuses : Imad Saleh, Jean-Charles Lamirel |
Mots clés
Mots clés contrôlés
Résumé
Nous vivons dans une société caractérisée par une obésité des données non raffinées disponibles dans différentes bases de données. Un écosystème où règne de l’information polluée qui empêche la transformation d’un nombre d’informations en connaissances productives, dans ce sens. les chercheurs dans le domaine de la recherche de l’information ont toujours insisté sur l’usage de l’information pertinente. Historiquement, la maitrise de l’information a été toujours l’enjeu de l’humanité pour conserver sa survie, à présent l’information doit être d’un degré de fiabilité suffisant pour éviter de polluer les connaissances. Le brevet est une source multidimensionnelle, source de premier plan en matière d’information.L’analyse instrumentée des données brevets devient une nécessité et constitue, pour les entreprises, les industriels et l’État, une ressource de mesure la plus efficace de l’activité inventive, pour une approche objective. La recherche dans les bases de données brevets est une tâche complexe pour plusieurs raisons, le nombre de brevets existants est très élevé et augmente rapidement, la recherche par mot-clé ne parvient pas à des résultats satisfaisants, les grandes entreprises ont recours à des professionnels capables de faire des recherches ciblées et efficaces, ce qui n’est pas souvent le cas pour les chercheurs universitaires, étudiants et d’autres profils. D’où la nécessité de l’intervention de la machine pour aider les experts et les non experts à mieux exploiter l’information en matière de brevets et démocratiser son usage. Ainsi, nous proposons une méthode d’accompagnement de l’usager à l’utilisation de cette documentation. Une voie qui s’appuie sur un référentiel normalisé des principes techniques imaginés par l’homme eux-mêmes décrits par des ensembles terminologiques que nous combinons avec des outils de traitement automatique des langues (TAL) pour s’absoudre des formes rédactionnelles des brevets et pour étendre les vocabulaires associés.