Thèse soutenue

Extraction de connaissances dans les bases de données parole : apport de l'apprentissage symbolique
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Paul Munteanu
Direction : Jean-François Serignat
Type : Thèse de doctorat
Discipline(s) : Sciences cognitives
Date : Soutenance en 1996
Etablissement(s) : Grenoble INPG en cotutelle avec Grenoble 1
Partenaire(s) de recherche : Laboratoire : Institut de la communication parlée (Grenoble1983-2007)

Résumé

FR

L'objectif principal de cette these est d'apporter des arguments, d'ordre theorique et experimental, pour soutenir l'interet des methodes d'apprentissage symbolique dans la recherche en communication parlee proche des signaux physiques. Dans un premier temps, nous presentons nos contributions en apprentissage symbolique qui visent a repondre a certaines particularites de ce domaine. Pmbc est un algorithme original d'apprentissage par generalisations successives dans les espaces numeriques, qui combine des heuristiques issues de l'apprentissage non-supervise, de la classification statistique et de l'induction de regles. L'analyse theorique sur laquelle est fonde notre deuxieme algorithme, idf, fournit une explication rigoureuse et des perspectives d'amelioration des heuristiques generalement utilisees dans l'induction d'arbres de decision, notamment dans le traitement des attributs numeriques. Les performances de ces deux algorithmes ont ete validees sur un grand nombre de bases de donnees utilisees generalement pour la comparaison des resultats d'apprentissage. Notre troisieme contribution, copac, est un environnement informatique d'induction interactive de regles de classification qui met l'accent sur la cooperation entre les methodes d'apprentissage automatique et les experts humains. Nous presentons ensuite des resultats experimentaux encourageants obtenus sur deux problemes representatifs des besoins en recherche dans le domaine de la parole: l'acquisition de connaissances prosodiques pour l'amelioration de l'acces lexical et la caracterisation des occlusives sourdes. La derniere partie de cette these est consacree a l'integration des methodes d'apprentissage symbolique dans l'environnement sidoc de gestion de donnees et de connaissances sur la parole, fonde sur le modele objet