Traduction automatique de la parole vers des pictogrammes

Cécile Macaire

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Traduction automatique de la parole vers des pictogrammes

FR |

EN

Auteur / Autrice :	Cécile Macaire
Direction :	Benjamin Lecouteux, Didier Schwab, Emmanuelle Esperança-Rodier
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 11/03/2025
Etablissement(s) :	Université Grenoble Alpes
Ecole(s) doctorale(s) :	École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble, Isère, France ; 1995-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'informatique de Grenoble (Isère, France ; 2007-....)
	Equipe de recherche : Groupe d'étude en traduction automatique - Traitement automatisé des langues et de la parole (Grenoble ; 2007-....)
Jury :	Président / Présidente : François Portet
	Examinateurs / Examinatrices : Nathalie Camelin
	Rapporteurs / Rapporteuses : Iris Eshkol, Frédéric Béchet

Mots clés

FR |

EN

Mots clés contrôlés

Icônes (infographie)

Communication alternative et améliorée

Traitement automatique de la parole

Mots clés libres

Communication Alternative et Augmentée

Pictogrammes

Traduction automatique de la parole

Reconnaissance automatique de la parole

Grand modèle de langue

Résumé

FR |

EN

La Communication Alternative et Augmentée (CAA) propose des méthodes et des outils pour pallier les déficiences de la production et de la compréhension de la parole. Les pictogrammes, éléments clés de la CAA, facilitent la communication des pensées et des émotions à travers une iconographie simplifiée. Cependant, des mythes et des barrières économiques freinent son déploiement, soulignant le besoin de solutions adaptées. La traduction automatique de la parole vers des pictogrammes, une nouvelle tâche du Traitement Automatique des Langues (TAL), vise à générer des séquences de pictogrammes à partir d'énoncés oraux. À l'intersection des domaines de la CAA et de la Traduction Automatique de la Parole (TAP), cette tâche peut faciliter la communication entre les aidants (personnels médicaux, proches) et des personnes souffrant de troubles du langage. Elle se heurte néanmoins à des défis majeurs, dont le manque de données multimodales unifiées, l'absence d'un cadre d'évaluation précis et l'inexistence de modèles neuronaux spécialisés pour proposer une traduction en pictogrammes. Dans cette thèse, nous présentons trois contributions pour relever ces défis. Nous introduisons deux méthodes de création de corpus multimodaux alignant de la parole, du texte et des pictogrammes. La première inclut une grammaire et un vocabulaire restreints pour générer une séquence de pictogrammes à partir de la transcription, tandis que la seconde intègre une chaîne de traitement pour récupérer l'audio des textes traduits en pictogrammes. Ces deux méthodes créent des ensembles de données robustes pour l’entraînement et l'évaluation des modèles. Dans notre deuxième contribution, nous définissons un cadre d'évaluation spécifique, combinant une évaluation automatique et humaine. Nous adaptons des métriques communément appliquées aux domaines de la Reconnaissance Automatique de la Parole (RAP) et de la Traduction Automatique (TA) pour comparer les performances entre modèles. Nous appliquons un cadre analytique pour interpréter la qualité des traductions. Enfin, dans notre troisième contribution, nous étudions deux approches, en cascade et de bout-en-bout, pour générer des séquences de pictogrammes à partir de la parole. Nous comparons des modèles de RAP, de TA et de TAP état de l'art, entraînés ou affinés sur les données multimodales créées. Les résultats de notre évaluation démontrent la capacité des modèles en cascade à produire des traductions en pictogrammes compréhensibles sur de la parole lue dans des contextes quotidiens. Nous démontrons des résultats compétitifs avec un modèle de bout-en-bout pour la parole spontanée, un défi persistant en TAL. Le code, les données et les modèles développés sont disponibles librement.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Traduction automatique de la parole vers des pictogrammes

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Traduction automatique de la parole vers des pictogrammes

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses