Thèse soutenue

Traitement automatique de rapports d’incidents et accidents : application à la gestion du risque dans l’aviation civile

FR  |  
BG  |  
EN
Auteur / Autrice : Nikola Tulechki
Direction : Ludovic Tanguy
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 30/09/2015
Etablissement(s) : Toulouse 2
Ecole(s) doctorale(s) : École doctorale Comportement, Langage, Éducation, Socialisation, Cognition (Toulouse)
Partenaire(s) de recherche : Equipe de recherche : Cognition, langues, langage, ergonomie (Toulouse ; 2006-....)
Laboratoire : Cognition- Langues- Langage- Ergonomie / CLLE-ERSS
Jury : Président / Présidente : Cécile Fabre
Examinateurs / Examinatrices : Ludovic Tanguy, Patrice Bellot, Yannick Toussaint
Rapporteurs / Rapporteuses : Patrice Bellot, Yannick Toussaint

Résumé

FR  |  
BG  |  
EN

Cette thèse décrit les applications du traitement automatique des langues (TAL) à la gestion des risques industriels. Elle se concentre sur le domaine de l'aviation civile, où le retour d'expérience (REX) génère de grandes quantités de données, sous la forme de rapports d'accidents et d'incidents. Nous commençons par faire un panorama des différentes types de données générées dans ce secteur d'activité. Nous analysons les documents, comment ils sont produits, collectés, stockés et organisés ainsi que leurs utilisations. Nous montrons que le paradigme actuel de stockage et d’organisation est mal adapté à l’utilisation réelle de ces documents et identifions des domaines problématiques ou les technologies du langage constituent une partie de la solution. Répondant précisément aux besoins d'experts en sécurité, deux solutions initiales sont implémentées : la catégorisation automatique de documents afin d'aider le codage des rapports dans des taxonomies préexistantes et un outil pour l'exploration de collections de rapports, basé sur la similarité textuelle. En nous basant sur des observations de l'usage de ces outils et sur les retours de leurs utilisateurs, nous proposons différentes méthodes d'analyse des textes issus du REX et discutons des manières dont le TAL peut être appliqué dans le cadre de la gestion de la sécurité dans un secteur à haut risque. En déployant et évaluant certaines solutions, nous montrons que même des aspects subtils liés à la variation et à la multidimensionnalité du langage peuvent être traités en pratique afin de gérer la surabondance de données REX textuelles de manière ascendante