Thèse soutenue

Variantes dialogiques et niveaux langagiers en environnement multilinguistique subsaharien : prise en compte des paramètres sociolectaux et idiolectaux pour l’adaptation dynamique d’un voicebot au profil du locuteur. Application à des services vocaux.

FR  |  
EN
Auteur / Autrice : Papa Séga Wade
Direction : Ioannis KanellosMihai Andries
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 21/07/2025
Etablissement(s) : Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur et le numérique
Partenaire(s) de recherche : Entreprise : Orange (entreprise)
Laboratoire : Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance (Brest ; 2012-....) - Equipe Robot interaction, Ambient system, Machine learning, Behaviour, Optimization
Jury : Président / Présidente : Jean-François Bonastre
Examinateurs / Examinatrices : Ioannis Kanellos, Mihai Andries, Adrian Popescu, Moussa Diallo, Adjaratou Oumar Sall
Rapporteurs / Rapporteuses : Adrian Popescu, Moussa Diallo

Résumé

FR  |  
EN

Dans les environnements subsahariens,le développement de systèmes vocaux intelligents s’opère dans un contexte linguistique et technologique complexe, marqué par le multilinguisme, l’oralité dominante et de fortes variations socio-linguistiques. Au Sénégal notamment, l’alternance entre wolof et français, la diversité des registres (formel ou informel, rural ou urbain), les disparités de niveau de langue et l’accès inégal aux outils numériques rendent les approches conventionnelles peu efficaces. Cette thèse vise à proposer des méthodes adaptées à ces contextes, en articulant traitement de la parole, transcription textuelle et modélisation linguistique. D’une part, une approche trimodale d’évaluation automatique de la fluence est développée, combinant indices textuels,acoustiques et prosodiques issus de modèles auto-supervisés, afin de mieux capturer la complexité de l’oralité. D’autre part, une méthode de segmentation adaptative de la parole est introduite, centrée sur la détection des disfluences dans des interactions spontanées. Enfin, une procédure d’adaptation dynamique de grands modèles de langage bilingues (wolof-français) est conçue pour permettre à un système vocal de générer des réponses contextualisées, sensibles au niveau de langue et au profil sociolinguistique du locuteur. Ces contributions s’inscrivent dans une perspective d’inclusion numérique et de personnalisation linguistique, ouvrant la voie à des voicebots plus équitables et culturellement adaptés.