Variantes dialogiques et niveaux langagiers en environnement multilinguistique subsaharien : prise en compte des paramètres sociolectaux et idiolectaux pour l’adaptation dynamique d’un voicebot au profil du locuteur. Application à des services vocaux.
| Auteur / Autrice : | Papa Séga Wade |
| Direction : | Ioannis Kanellos, Mihai Andries |
| Type : | Thèse de doctorat |
| Discipline(s) : | Informatique |
| Date : | Soutenance le 21/07/2025 |
| Etablissement(s) : | Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire |
| Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur et le numérique |
| Partenaire(s) de recherche : | Entreprise : Orange (entreprise) |
| Laboratoire : Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance (Brest ; 2012-....) - Equipe Robot interaction, Ambient system, Machine learning, Behaviour, Optimization | |
| Jury : | Président / Présidente : Jean-François Bonastre |
| Examinateurs / Examinatrices : Ioannis Kanellos, Mihai Andries, Adrian Popescu, Moussa Diallo, Adjaratou Oumar Sall | |
| Rapporteurs / Rapporteuses : Adrian Popescu, Moussa Diallo |
Mots clés
Résumé
Dans les environnements subsahariens,le développement de systèmes vocaux intelligents s’opère dans un contexte linguistique et technologique complexe, marqué par le multilinguisme, l’oralité dominante et de fortes variations socio-linguistiques. Au Sénégal notamment, l’alternance entre wolof et français, la diversité des registres (formel ou informel, rural ou urbain), les disparités de niveau de langue et l’accès inégal aux outils numériques rendent les approches conventionnelles peu efficaces. Cette thèse vise à proposer des méthodes adaptées à ces contextes, en articulant traitement de la parole, transcription textuelle et modélisation linguistique. D’une part, une approche trimodale d’évaluation automatique de la fluence est développée, combinant indices textuels,acoustiques et prosodiques issus de modèles auto-supervisés, afin de mieux capturer la complexité de l’oralité. D’autre part, une méthode de segmentation adaptative de la parole est introduite, centrée sur la détection des disfluences dans des interactions spontanées. Enfin, une procédure d’adaptation dynamique de grands modèles de langage bilingues (wolof-français) est conçue pour permettre à un système vocal de générer des réponses contextualisées, sensibles au niveau de langue et au profil sociolinguistique du locuteur. Ces contributions s’inscrivent dans une perspective d’inclusion numérique et de personnalisation linguistique, ouvrant la voie à des voicebots plus équitables et culturellement adaptés.