Fouille de données textuelles et systèmes de recommandation appliqués aux offres d'emploi diffusées sur le web - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2012

Text mining and recommender systems applied to job postings

Fouille de données textuelles et systèmes de recommandation appliqués aux offres d'emploi diffusées sur le web

Résumé

Last years, e-recruitment expansion has led to the multiplication of web channels dedicated to job postings. In an economic context where cost control is fundamental, assessment and comparison of recruitment channel performances have become necessary. The purpose of this work is to develop a decision-making tool intended to guide recruiters while they are posting a job on the Internet. This tool provides to recruiters the expected performance on job boards for a given job offer. First, we identify the potential predictors of a recruiting campaign performance. Then, we apply text mining techniques to the job offer texts in order to structure postings and to extract information relevant to improve their description in a predictive model. The job offer performance predictive algorithm is based on a hybrid recommender system, suitable to the cold-start problem. The hybrid system, based on a supervised similarity measure, outperforms standard multivariate models. Our experiments are led on a real dataset, coming from a job posting database.
L'expansion du média Internet pour le recrutement a entraîné ces dernières années la multiplication des canaux dédiés à la diffusion des offres d'emploi. Dans un contexte économique où le contrôle des coûts est primordial, évaluer et comparer les performances des différents canaux de recrutement est devenu un besoin pour les entreprises. Cette thèse a pour objectif le développement d'un outil d'aide à la décision destiné à accompagner les recruteurs durant le processus de diffusion d'une annonce. Il fournit au recruteur la performance attendue sur les sites d'emploi pour un poste à pourvoir donné. Après avoir identifié les facteurs explicatifs potentiels de la performance d'une campagne de recrutement, nous appliquons aux annonces des techniques de fouille de textes afin de les structurer et d'en extraire de l'information pertinente pour enrichir leur description au sein d'un modèle explicatif. Nous proposons dans un second temps un algorithme prédictif de la performance des offres d'emploi, basé sur un système hybride de recommandation, adapté à la problématique de démarrage à froid. Ce système, basé sur une mesure de similarité supervisée, montre des résultats supérieurs à ceux obtenus avec des approches classiques de modélisation multivariée. Nos expérimentations sont menées sur un jeu de données réelles, issues d'une base de données d'annonces publiées sur des sites d'emploi.
Fichier principal
Vignette du fichier
Julie_-_SEGUELA-thse_-_confidentielle.pdf (4.9 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)
Loading...

Dates et versions

tel-01519304 , version 1 (06-05-2017)

Identifiants

  • HAL Id : tel-01519304 , version 1

Citer

Julie Séguéla. Fouille de données textuelles et systèmes de recommandation appliqués aux offres d'emploi diffusées sur le web. Informatique et langage [cs.CL]. Conservatoire national des arts et metiers - CNAM, 2012. Français. ⟨NNT : 2012CNAM0801⟩. ⟨tel-01519304⟩
908 Consultations
612 Téléchargements

Partager

Gmail Facebook X LinkedIn More