Auteur / Autrice : | Lucie Gianola |
Direction : | Julien Longhi |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences du langage |
Date : | Soutenance le 28/02/2020 |
Etablissement(s) : | CY Cergy Paris Université |
Ecole(s) doctorale(s) : | Ecole doctorale Arts, Humanités, Sciences Sociales (Cergy-Pontoise, Val d'Oise) |
Partenaire(s) de recherche : | Laboratoire : AGORA (Cergy-Pontoise) |
Jury : | Président / Présidente : Sylvie Monjean-Decaudin |
Examinateurs / Examinatrices : Julien Longhi, Patrick Paroubek, Olivier Ribaux, Bénédicte Pincemin, Laurent Chartier | |
Rapporteurs / Rapporteuses : Patrick Paroubek |
Mots clés
Résumé
L’analyse criminelle est une discipline d’appui aux enquêtes pratiquée au sein de la Gendarmerie Nationale. Elle repose sur l’exploitation des documents compilés dans le dossier de procédure judiciaire (auditions, perquisitions, rapports d’expertise, données téléphoniques et bancaires, etc.) afin de synthétiser les informations collectées et de proposer un regard neuf sur les faits examinés. Si l’analyse criminelle a recours à des logiciels de visualisation de données (i. e. Analyst’s Notebook d’IBM) pour la mise en forme des hypothèses formulées, la gestion informatique et textuelle des documents de la procédure est entièrement manuelle. Or, l’analyse criminelle s’appuie entre autres sur le concept d’entités pour formaliser son travail.La présentation du contexte de recherche détaille la pratique de l’analyse criminelle ainsi que la constitution du dossier de procédure judiciaire en tant que corpustextuel.Nous proposons ensuite des perspectives pour l’adaptation des méthodes de traitement automatique de la langue (TAL) et d’extraction d’information au cas d’étude, notamment la mise en parallèle des concepts d’entité en analyse criminelle et d’entité nommée en TAL. Cette comparaison est réalisée sur les plans conceptuels et linguistiques. Une première approche de détection des entités dans les auditions de témoins est présentée.Enfin, le genre textuel étant un paramètre à prendre en compte lors de l’appli-cation de traitements automatiques à du texte, nous construisons une structuration du genre textuel « légal » en discours, genres et sous-genres par le biais d’une étude textométrique visant à caractériser différents types de textes (dont les auditions de témoins) produits par le domaine de la justice.