Thèse en cours

Recherche d'information précise par processus hybrides

FR  |  
EN
Auteur / Autrice : Romain Beaumont
Direction : Brigitte Grau
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/10/2014
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : LIMSI - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur
Equipe de recherche : ILES - Information, Langue Ecrite et Signée
établissement de préparation de la thèse : Université Paris-Sud (1970-2019)

Résumé

FR  |  
EN

Contexte Le contexte de cette thèse est la recherche d'informations précises en langage naturel dans des textes et dans des bases de connaissances. Désormais de nombreuses bases de connaissances sont disponibles à travers les open linked data (Freebase, DBPedia...). Les interfaces en langage naturel pour ces bases de connaissance permettent d'exploiter l'expressivité des modèles de données sémantiques, tout en masquant leur complexité pour les utilisateurs. Par ailleurs, se sont développés depuis de nombreuses années des systèmes de réponse à des questions permettant de rechercher le même type d'information dans des textes. Les données structurés offrent l'avantage d'être non ambiguës, mais d'une couverture restreinte, et nécessitent de traduire une question en langue vers un langage de requête. Les textes en revanche offrent une plus grande couverture des informations, mais ces informations sont non structurées, ambiguës, et de formulation variable. La recherche d'information précise dans des textes et dans des bases de connaissance sont actuellement étudiées de façon indépendante, et les méthodes proposées sont fortement dépendantes de la représentation de l'information cherchée et du domaine couvert. Les problèmes posés sont cependant en partie identiques : reconnaître les informations importantes dans les questions, et les typer, en tenant compte de la variation linguistique. Objectifs Développer des méthodes de recherche d'information précise génériques exploitant des ressources structurées ou textuelles. Il s'agira d'étudier comment intégrer ces approches dans un cadre unifié dans le but de développer des techniques novatrices de représentation/compréhension du texte. L'objectif est d'élaborer une représentation sémantique des questions de suffisamment haut niveau pour pouvoir ensuite être adaptée aux différents contextes de recherche d'informations, que ce soit en domaine ouvert ou dans un domaine de spécialité.