Thèse soutenue

Détection d'événements géo-chrono-localisés dans les tweets

FR  |  
EN
Auteur / Autrice : Hosni Seffih
Direction : Myriam Lamolle
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 17/12/2020
Etablissement(s) : Paris 8
Ecole(s) doctorale(s) : École doctorale Cognition, langage, interaction (Saint-Denis, Seine-Saint-Denis)
Partenaire(s) de recherche : Equipe de recherche : Laboratoire d' informatique avancée de Saint-Denis
Jury : Président / Présidente : Abderrahman El Mhamedi
Examinateurs / Examinatrices : Ernesto Esposito, Christian Fluhr
Rapporteurs / Rapporteuses : Sylvie Despres, Patrick Paroubek

Résumé

FR  |  
EN

La détection d'événements à partir de textes est un défi encore aujourd'hui, surtout dans le contexte des réseaux sociaux, les informations sont souvent écrites d'une manière simplifiée. Lors de ces travaux de recherche, nous avons cherché à extraire des événements géo-chrono-localisés dans des tweets. En concentrant l'expérimentation sur la ville de Nice. Pour arriver à nos fins, nous devons faire face à trois verrous scientifiques à savoir (i) la constitution d'un corpus pertinent sur un territoire particulier en regard d'une liste d'événements, (ii) le traitement sémantique des réseaux sociaux et plus particulièrement Twitter, (iii) la détection des éléments qui composent un événement afin de lever toute ambiguïté sur son importance car il sera déclencheur d'alerte. Le système proposé, appelé GEOLsig, passe par la gestion du flux des tweets (récupération de tweets + prétraitement de l'orthographe) puis transformation du texte brut des tweets en texte structuré afin de passer à la phase d'extraction de l'information des lieux, des dates et des actions. Afin de vérifier la pertinence du processus complet des traitements linguistiques effectués, nous avons mené des expérimentations sur différents corpus de tweets. Nos futurs travaux aborderont à court terme la détection automatique implémenté par un bot sur Twitter, et à plus long terme, (i) l'optimisation du couplage BERT / traitements linguistiques et sémantiques GEOL,(ii) le traitement d'autres langues, (iii) l'extension de la solution à d'autres réseaux sociaux.