Thèse soutenue

Résumé comparatif cross-lingue et multilingue

FR  |  
EN
Auteur / Autrice : Valentin Nyzam
Direction : Myriam Lamolle
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 07/07/2021
Etablissement(s) : Paris 8
Ecole(s) doctorale(s) : École doctorale Cognition, langage, interaction (Saint-Denis, Seine-Saint-Denis)
Partenaire(s) de recherche : Equipe de recherche : Laboratoire d' informatique avancée de Saint-Denis
Jury : Président / Présidente : Thierry Charnois
Examinateurs / Examinatrices : Nedra Mellouli, Anne-Laure Ligozat, Thierry Poibeau, Aurélien Brossard
Rapporteurs / Rapporteuses : Patrick Paroubek, Guy Lapalme

Résumé

FR  |  
EN

La mondialisation de l’information numérique apporte à la fois son lot de nouvelles possibilités et de défis. Parmi les nouvelles possibilités offertes par l’aspect international et massif de l’information numérique, l’analyse automatique de documents rédigés dans des langues différentes est sûrement l’une de celles qui ouvrira le plus de débouchés tout en apportant son lot de difficultés scientifiques.Il existe aujourd’hui de nombreuses méthodes différentes et dans le cadre d’études scientifiques, il n’est pas toujours simple de comparer ces méthodes entre elles. Nous proposons ainsi un état de l’art relativement large de toutes les méthodes et techniques utilisées pour le résumé automatique. Ce travail préalable nous permet de proposer une solution au problème précédent avec un outil de résumé automatique modulaire et open source développé en Java, MOTS : MOdular Tool for Summarization.Nous étudions également une tâche relativement récente du résumé automatique, le résumé comparatif. Cette tâche cherche à simplifier la vie d’un utilisateur lisant des articles de journaux sur internet. Si celui-ci cherche des informations dans une thématique donnée, il trouvera plusieurs documents intéressants. Il souhaitera probablement comparer cet ensemble de documents initial à d’autres documents traitant de la même thématique. De plus, dans le contexte actuel de globalisation de l’information, il est important de permettre de comparer des documents dans des langues différentes. Pour cela, nous proposons une méthode novatrice pour le résumé comparatif multilingue et crosslingue en évaluant diverses méthodes de détection de la comparativité et leur adaptation multilingue.