Résumé comparatif cross-lingue et multilingue
Auteur / Autrice : | Valentin Nyzam |
Direction : | Myriam Lamolle |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 07/07/2021 |
Etablissement(s) : | Paris 8 |
Ecole(s) doctorale(s) : | École doctorale Cognition, langage, interaction (Saint-Denis, Seine-Saint-Denis) |
Partenaire(s) de recherche : | Equipe de recherche : Laboratoire d' informatique avancée de Saint-Denis |
Jury : | Président / Présidente : Thierry Charnois |
Examinateurs / Examinatrices : Nedra Mellouli, Anne-Laure Ligozat, Thierry Poibeau, Aurélien Brossard | |
Rapporteurs / Rapporteuses : Patrick Paroubek, Guy Lapalme |
Résumé
La mondialisation de l’information numérique apporte à la fois son lot de nouvelles possibilités et de défis. Parmi les nouvelles possibilités offertes par l’aspect international et massif de l’information numérique, l’analyse automatique de documents rédigés dans des langues différentes est sûrement l’une de celles qui ouvrira le plus de débouchés tout en apportant son lot de difficultés scientifiques.Il existe aujourd’hui de nombreuses méthodes différentes et dans le cadre d’études scientifiques, il n’est pas toujours simple de comparer ces méthodes entre elles. Nous proposons ainsi un état de l’art relativement large de toutes les méthodes et techniques utilisées pour le résumé automatique. Ce travail préalable nous permet de proposer une solution au problème précédent avec un outil de résumé automatique modulaire et open source développé en Java, MOTS : MOdular Tool for Summarization.Nous étudions également une tâche relativement récente du résumé automatique, le résumé comparatif. Cette tâche cherche à simplifier la vie d’un utilisateur lisant des articles de journaux sur internet. Si celui-ci cherche des informations dans une thématique donnée, il trouvera plusieurs documents intéressants. Il souhaitera probablement comparer cet ensemble de documents initial à d’autres documents traitant de la même thématique. De plus, dans le contexte actuel de globalisation de l’information, il est important de permettre de comparer des documents dans des langues différentes. Pour cela, nous proposons une méthode novatrice pour le résumé comparatif multilingue et crosslingue en évaluant diverses méthodes de détection de la comparativité et leur adaptation multilingue.