Thèse soutenue

Aspects textuels de la procédure judiciaire exploitée en analyse criminelle et perspectives pour son traitement automatique
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Lucie Gianola
Direction : Julien Longhi
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 28/02/2020
Etablissement(s) : CY Cergy Paris Université
Ecole(s) doctorale(s) : Ecole doctorale Arts, Humanités, Sciences Sociales (Cergy-Pontoise, Val d'Oise)
Partenaire(s) de recherche : Laboratoire : AGORA (Cergy-Pontoise)
Jury : Président / Présidente : Sylvie Monjean-Decaudin
Examinateurs / Examinatrices : Julien Longhi, Patrick Paroubek, Olivier Ribaux, Bénédicte Pincemin, Laurent Chartier
Rapporteurs / Rapporteuses : Patrick Paroubek

Résumé

FR  |  
EN

L’analyse criminelle est une discipline d’appui aux enquêtes pratiquée au sein de la Gendarmerie Nationale. Elle repose sur l’exploitation des documents compilés dans le dossier de procédure judiciaire (auditions, perquisitions, rapports d’expertise, données téléphoniques et bancaires, etc.) afin de synthétiser les informations collectées et de proposer un regard neuf sur les faits examinés. Si l’analyse criminelle a recours à des logiciels de visualisation de données (i. e. Analyst’s Notebook d’IBM) pour la mise en forme des hypothèses formulées, la gestion informatique et textuelle des documents de la procédure est entièrement manuelle. Or, l’analyse criminelle s’appuie entre autres sur le concept d’entités pour formaliser son travail.La présentation du contexte de recherche détaille la pratique de l’analyse criminelle ainsi que la constitution du dossier de procédure judiciaire en tant que corpustextuel.Nous proposons ensuite des perspectives pour l’adaptation des méthodes de traitement automatique de la langue (TAL) et d’extraction d’information au cas d’étude, notamment la mise en parallèle des concepts d’entité en analyse criminelle et d’entité nommée en TAL. Cette comparaison est réalisée sur les plans conceptuels et linguistiques. Une première approche de détection des entités dans les auditions de témoins est présentée.Enfin, le genre textuel étant un paramètre à prendre en compte lors de l’appli-cation de traitements automatiques à du texte, nous construisons une structuration du genre textuel « légal » en discours, genres et sous-genres par le biais d’une étude textométrique visant à caractériser différents types de textes (dont les auditions de témoins) produits par le domaine de la justice.