Régression linéaire bayésienne sur données fonctionnelles

Paul-Marie Grollemund

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Régression linéaire bayésienne sur données fonctionnelles

FR |

EN

Auteur / Autrice :	Paul-Marie Grollemund
Direction :	Christophe Abraham, Pierre Pudlo
Type :	Thèse de doctorat
Discipline(s) :	Biostatistique
Date :	Soutenance le 22/11/2017
Etablissement(s) :	Montpellier
Ecole(s) doctorale(s) :	École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....)
Partenaire(s) de recherche :	Laboratoire : Institut Montpelliérain Alexander Grothendieck (Montpellier ; 2003-....)
Jury :	Président / Présidente : Éric Parent
	Examinateurs / Examinatrices : Christophe Abraham, Pierre Pudlo, Éric Parent, Pierre Druilhet, Judith Rousseau, Meïli Baragatti, André Mas, Anne Philippe
	Rapporteur / Rapporteuse : Pierre Druilhet, Judith Rousseau

Mots clés

FR |

EN

Mots clés contrôlés

Analyse de régression

Statistique bayésienne

Mots clés libres

Régression linéaire fonctionnelle

Résumé

FR |

EN

Un outil fondamental en statistique est le modèle de régression linéaire. Lorsqu'une des covariables est une fonction, on fait face à un problème de statistique en grande dimension. Pour conduire l'inférence dans cette situation, le modèle doit être parcimonieux, par exemple en projetant la covariable fonctionnelle dans des espaces de plus petites dimensions. Dans cette thèse, nous proposons une approche bayésienne nommée Bliss pour ajuster le modèle de régression linéaire fonctionnel. Notre modèle, plus précisément la distribution a priori, suppose que la fonction coefficient est une fonction en escalier. A partir de la distribution a posteriori, nous définissons plusieurs estimateurs bayésiens, à choisir suivant le contexte : un estimateur du support et deux estimateurs, un lisse et un estimateur constant par morceaux. A titre d'exemple, nous considérons un problème de prédiction de la production de truffes noires du Périgord en fonction d'une covariable fonctionnelle représentant l'évolution des précipitations au cours du temps. En terme d'impact sur les productions, la méthode Bliss dégage alors deux périodes de temps importantes pour le développement de la truffe. Un autre atout du paradigme bayésien est de pouvoir inclure de l'information dans la loi a priori, par exemple l'expertise des trufficulteurs et des biologistes sur le développement de la truffe. Dans ce but, nous proposons deux variantes de la méthode Bliss pour prendre en compte ces avis. La première variante récolte de manière indirecte l'avis des experts en leur proposant de construire des données fictives. La loi a priori correspond alors à la distribution a posteriori sachant ces pseudo-données. En outre, un système de poids relativise l'impact de chaque expert ainsi que leurs corrélations. La seconde variante récolte explicitement l'avis des experts sur les périodes de temps les plus influentes sur la production et si cet l'impact est positif ou négatif. La construction de la loi a priori repose alors sur une pénalisation des fonctions coefficients en contradiction avec ces avis. Enfin, ces travaux de thèse s'attachent à l'analyse et la compréhension du comportement de la méthode Bliss. La validité de l'approche est justifiée par une étude asymptotique de la distribution a posteriori. Nous avons construit un jeu d'hypothèses spécifique au modèle Bliss, pour écrire une démonstration efficace d'un théorème de Wald. Une des difficultés est la mauvaise spécification du modèle Bliss, dans le sens où la vraie fonction coefficient n'est sûrement pas une fonction en escalier. Nous montrons que la loi a posteriori se concentre autour d'une fonction coefficient en escalier, obtenue par projection au sens de la divergence de Kullback-Leibler de la vraie fonction coefficient sur un ensemble de fonctions en escalier. Nous caractérisons cette fonction en escalier à partir du design et de la vraie fonction coefficient.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Régression linéaire bayésienne sur données fonctionnelles

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Régression linéaire bayésienne sur données fonctionnelles

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses