Gestion de stock sous contrainte de quantité minimale de commande multi-références - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Inventory control of multi-item systems with minimum order quantity constraints

Gestion de stock sous contrainte de quantité minimale de commande multi-références

Résumé

Manufacturers and suppliers can often leverage economies of scale to reduce their manufacturing and transportation costs, since it dilutes the impact of fixed costs. Many actors in supply chains choose to shift the burden of these fixed costs to their purchasing entities, by introducing mandatory minimum order size (for example on the total monetary value of the order). We define the Minimum Order Quantity (MOQ) problem as the inventory control problem that purchasing entities which are themselves retailers face in this situation. A retailer in this situation should aim to replenish its inventory stock levels to a balanced state, to avoid stock-outs and overstocks, while satisfying its supplier constraint.There are several methods in the literature that deal with simplified versions of this problem, notably for the single item or the stationary demand versions of the problem. However, no state of the art solution was able to provide a realistic solution to the multi-item, variable demand version of the problem.The main contributions of this thesis are two methods that compute approximate solutions to this problem. The first one is the w-policy, a heuristic based on several assumptions of the system. These assumptions were justified by a extensive analysis of the MOQ problem. They drastically reduce the complexity of the computation of the value functions, which leads to an efficient computation of an approximate solution. The scope of applicability of the w-policy is however bounded, and this policy is inapplicable in some specific settings. In order to overcome this limitation, we developed a second method that we called the 'hybdrid' policy. This method combines reinforcement learning techniques (notably deep Q-learning) with some ideas from the w-policy. We demonstrate the ability of these two methods to solve the MOQ problem efficiently on simulated and real datasets, on scales that were unprecedented (up to ten thousand items).
Dans de nombreuses chaînes logistiques, il est courant que les fournisseurs imposent une quantité minimale d'achat à leurs acheteurs (par exemple sur la valeur totale de la commande), dans le but de diluer l'impact de leurs coûts fixes. Dans le cas où cet acheteur est lui même un revendeur, ce dernier est alors soumis à un problème d'optimisation de stock difficile: il doit d'un côté maintenir un stock suffisant pour satisfaire la demande (instable et non certaine) de ses clients, et de l'autre réduire ses coûts de stock, tout en respectant la contrainte de son fournisseur. C'est ce problème de prise de décision sous incertitude que nous avons cherché à résoudre au cours de cette thèse. Nous l'appelons \textit{problème de quantité minimale de commande multi-références}.Il existe plusieurs méthodes dans la littérature pour résoudre des versions simplifiées de ce problème, notamment lorsqu'une seule référence est concernée par la contrainte, ou lorsque la demande est supposée stationnaire. Cependant, aucune solution de l'état de l'art n'apportait jusqu'alors de réponse satisfaisante à la version multi-référence de ce problème, avec un inventaire soumis à une demande stochastique et variable dans le temps.Les principales contributions de cette thèse sont deux méthodes de résolution approximative de ce problème. La première est une heuristique que nous appelons la w-policy. Cette heuristique repose sur plusieurs approximations du comportement du système. Ces approximations, basées sur une analyse poussée du problème, permettent de réduire drastiquement la complexité du calcul des fonctions de valeur et d'en déduire une solution approximative. Cependant, en raison de ces hypothèses, la w-policy ne peut pas être appliquée dans certains cas particuliers. Dans le but de remédier à cette limite, nous avons développé une deuxième méthode que nous appelons la hybrid policy. Cette méthode combine des techniques issues de l'apprentissage par renforcement (notamment le deep Q-learning) avec certaines idées issues de la w-policy. Nous montrons la capacité de ces deux méthodes à résoudre efficacement le problème posé, en l'appliquant à des jeux de données réelles et simulées. Sur les versions de grande taille du problème (jusqu'à dix mille références), elles sont les seules aujourd'hui à apporter une solution calculable en un temps raisonnable.
Fichier principal
Vignette du fichier
gaetandeletoille.pdf (3.76 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03896664 , version 1 (13-12-2022)

Identifiants

  • HAL Id : tel-03896664 , version 1

Citer

Gaetan Deletoille. Gestion de stock sous contrainte de quantité minimale de commande multi-références. Recherche opérationnelle [math.OC]. Normandie Université, 2022. Français. ⟨NNT : 2022NORMR029⟩. ⟨tel-03896664⟩
165 Consultations
46 Téléchargements

Partager

Gmail Facebook X LinkedIn More