Thèse soutenue

Inférence statistique pour des processus markoviens et semi-markoviens basée sur des mesures de divergence.

FR  |  
EN
Auteur / Autrice : Thomas Gkelsinis
Direction : Vlad Barbu
Type : Thèse de doctorat
Discipline(s) : Mathematiques
Date : Soutenance le 28/11/2023
Etablissement(s) : Normandie
Ecole(s) doctorale(s) : École doctorale mathématiques, information et ingénierie des systèmes (Caen)
Partenaire(s) de recherche : Equipe de recherche : Laboratoire de mathématiques Raphaël Salem (Saint-Etienne-du-Rouvray, Seine-Maritime ; 2000-...)
établissement co-accrédité : Université de Rouen Normandie (1966-....)
Jury : Président / Présidente : Sergei Pergamenshchikov
Examinateurs / Examinatrices : Bojana Milosevic, Mitra Fouladirad, Amor Keziou, Nathalie Peyrard
Rapporteurs / Rapporteuses : Salim Bouzebda, Michel Broniatowski

Résumé

FR  |  
EN

Cette thèse est dédiée aux techniques de statistique inférentielle pour des processus markoviens et semi-markoviens, techniques basées sur des mesures de divergence; une partie de la thèse est aussi dédiée à la modélisation de la fiabilité pour ce type de processus. Plus précisément, on propose une méthodologie statistique basée sur des types particuliers de mesures de divergence, afin de construire des tests d'hypothèses pour des processus markoviens et semi-markoviens. Un des problèmes statistiques les plus courants est l'identification du comportement stochastique qui gouverne l'évolution d'un système aléatoire pour lequel on connaît seulement un échantillon fini; ce problème est souvent connu sous le nom de test d'adéquation. Un cadre particulier de cette situation est lorsqu'on souhaite comparer le comportement stochastique de deux systèmes aléatoires, en observant seulement une partie finie de leurs trajectoires passées.Dans un premier temps, nous étudions l'application de la mesure de divergence de Kullback-Leibler pondérée et corrigée pour construire des tests à un échantillon et à deux échantillons pour des variables aléatoires indépendantes identiquement distribuées (i.i.d.), comme proposé dans. Deux tests statistiques sont proposés, le test d'adéquation pondéré (WGoF) et le test d'homogénéité pondéré (WHom). L'utilisation de cette méthodologie permet aux chercheurs de se concentrer sur des régions particulières du support, tout en retenant une partie de l'information relative aux autres parties. Nous déduisons les lois asymptotiques des statistiques des tests sous l'hypothèse nulle. Des simulations Monte Carlo intensives sont présentées afin d'évaluer les performances des tests, en termes des erreurs de première et seconde espèce.Dans un second temps, nous étendons ces résultats de tests d'hypothèses simples au cadre des chaînes de Markov d'ordre général, en prenant en compte l'information a priori qu'on peut avoir sur l'utilité de chaque transition pour un système multi-états. Pour cela, nous considérons la version pondérée de la φ-divergence entre des chaînes de Markov d'ordre général, ensemble avec la statistique de test basée sur cette divergence. Des exemples importants de cette famille sont les statistiques de test de chi-deux et du rapport de vraisemblance. Par conséquent, la méthodologie que nous proposons représente une extension qui inclut des techniques existantes, vues comme des cas spécifiques où il n'y a pas d'information a priori qui est prise en compte. Nous obtenons les lois asymptotiques des statistiques des tests sous l'hypothèse nulle.En suivant la trajectoire de la thèse, après les cadres i.i.d. et Markov, il est raisonnable de continuer avec un cadre semi-markovien. Dans cette direction, on propose une famille de φ-divergences pour des chaînes semi-markoviennes et les statistiques de test correspondantes, afin de construire des tests d'hypothèses à un échantillon et à deux échantillons. La méthodologie et les outils proposés dans ce chapitre étendent le but des tests d'hypothèses pour des chaînes semi-markoviennes au-delà de l'application classique des tests, en considérant une famille générale de tests, issue des choix possibles de la fonction φ liée à la φ-divergence. Nous obtenons les lois asymptotiques des statistiques des tests sous l'hypothèse nulle et aussi la fonction puissance sous une alternative fixée.La partie finale de la thèse est dédiée à la modélisation de la fiabilité pour des chaînes semi-markoviennes, comme proposé. Plus précisément, on s'intéresse à une nouvelle mesure de fiabilité, appelée Fiabilité Séquentielle par Intervalles (SIR), qui quantifie la probabilité que le système soit opérationnel pendant une séquence donnée d'intervalles qui ne se chevauchent pas. Il s'agit d'une mesure qui inclut, comme cas particuliers, plusieurs mesures classiques de fiabilité, comme la fonction de fiabilité, la fiabilité par intervalle ou bien la disponibilité.