1 |
Sur l'estimation non paramétrique des modèles conditionnels pour variables fonctionnelles spatialement dépendantes / On the nonparametric estimation of certain conditional models in functional spatial dataKaid, Zoulikha 09 December 2012 (has links)
Dans cette thèse, nous nous intéressons au problème de la prévision spatiale en considérant des modèles non paramétriques conditionnels dont la variable explicative est fonctionnelle. Plus précisément, les points étudiés pour décrire la co-variation spatiale entre une variable réponse réelle et une variable fonctionnelle sont le mode conditionnel et les quantiles conditionnels.En ce qui concerne le mode conditionnel, nous établissons la convergence presque complète, la convergence en norme Lp et la normalité asymptotique d'un estimateur à noyau. Ces propriétés asymptotiques sont obtenues sous des conditions assez générales telles, l'hypothèse de mélange forte et l'hypothèse de concentration de la mesure de probabilité de la variable explicative fonctionnelle. L'implémentation de l'estimateur construit en pratique est illustrée par une application sur des données météorologiques.Le modèle des quantiles conditionnels est abordé dans la deuxième partie de la thèse. Il est traité comme fonction inverse de la fonction de répartition conditionnelle qui est estimée par un estimateur à double noyaux. Sous les mêmes conditions que celles du modèle précédent, nous donnons l'expression de la vitesse de convergence en norme Lp et nous démontrons la normalité asymptotique de l'estimateur construit.Notre étude généralise au cas spatial de nombreux résultats déjà existant en série chronologique fonctionnelle. De plus, l'estimation de nos modèles repose sur une estimation préalable de la densité et de la fonction de répartition conditionnelles et permet de construire des régions prédictives, montrant ainsi l'apport de ce genre de modèles par rapport à la régression classique. / The main purpose of this thesis concerns the problem of spatial prediction using some nonparametric conditional models where the covariate variable is a functional one. More precisely, we treat the nonparametric estimation of the conditional mode and that of the conditional quantiles as spatial prediction tools alternative to the classical spatial regression of real response variable given a functional variable.Concerning the first model, that is the conditional mode, it is estimated by maximizing the spatial version of the kernel estimate of the conditional density. Under a general mixing condition and the concentration properties of the probability measure of the functional variable, we establish the almost complete convergence (with rate), the Lp consistency (with rate) and the asymptotic normality of the considered estimator. The usefulness of this estimation is illustrated by an application on real meteorological data.The model of the conditional quantiles is considered in the second part of this thesis and is treated as the inverse function of the conditional cumulative distribution function which is estimated by a double kernel estimator. Under the same general conditions as in the first model, we give the convergence rate in the Lp- norm and we show the asymptotic normality of the constructed estimator. These asymptotic results are closely related to the concentration properties on small balls of the probability measure of the underlying explanatory variable and the regularity of the conditional cumulative distribution function.Our study generalizes to spatial case some existing results in functional times series case. Finally, we highlight what our models brings compared to classical regression, discussing the use of our results as preliminary works to construct predictive regions.
|
2 |
Contribution à la statistique spatiale et l'analyse de données fonctionnelles / Contribution to spatial statistics and functional data analysisAhmed, Mohamed Salem 12 December 2017 (has links)
Ce mémoire de thèse porte sur la statistique inférentielle des données spatiales et/ou fonctionnelles. En effet, nous nous sommes intéressés à l’estimation de paramètres inconnus de certains modèles à partir d’échantillons obtenus par un processus d’échantillonnage aléatoire ou non (stratifié), composés de variables indépendantes ou spatialement dépendantes.La spécificité des méthodes proposées réside dans le fait qu’elles tiennent compte de la nature de l’échantillon étudié (échantillon stratifié ou composé de données spatiales dépendantes).Tout d’abord, nous étudions des données à valeurs dans un espace de dimension infinie ou dites ”données fonctionnelles”. Dans un premier temps, nous étudions les modèles de choix binaires fonctionnels dans un contexte d’échantillonnage par stratification endogène (échantillonnage Cas-Témoin ou échantillonnage basé sur le choix). La spécificité de cette étude réside sur le fait que la méthode proposée prend en considération le schéma d’échantillonnage. Nous décrivons une fonction de vraisemblance conditionnelle sous l’échantillonnage considérée et une stratégie de réduction de dimension afin d’introduire une estimation du modèle par vraisemblance conditionnelle. Nous étudions les propriétés asymptotiques des estimateurs proposées ainsi que leurs applications à des données simulées et réelles. Nous nous sommes ensuite intéressés à un modèle linéaire fonctionnel spatial auto-régressif. La particularité du modèle réside dans la nature fonctionnelle de la variable explicative et la structure de la dépendance spatiale des variables de l’échantillon considéré. La procédure d’estimation que nous proposons consiste à réduire la dimension infinie de la variable explicative fonctionnelle et à maximiser une quasi-vraisemblance associée au modèle. Nous établissons la consistance, la normalité asymptotique et les performances numériques des estimateurs proposés.Dans la deuxième partie du mémoire, nous abordons des problèmes de régression et prédiction de variables dépendantes à valeurs réelles. Nous commençons par généraliser la méthode de k-plus proches voisins (k-nearest neighbors; k-NN) afin de prédire un processus spatial en des sites non-observés, en présence de co-variables spatiaux. La spécificité du prédicteur proposé est qu’il tient compte d’une hétérogénéité au niveau de la co-variable utilisée. Nous établissons la convergence presque complète avec vitesse du prédicteur et donnons des résultats numériques à l’aide de données simulées et environnementales.Nous généralisons ensuite le modèle probit partiellement linéaire pour données indépendantes à des données spatiales. Nous utilisons un processus spatial linéaire pour modéliser les perturbations du processus considéré, permettant ainsi plus de flexibilité et d’englober plusieurs types de dépendances spatiales. Nous proposons une approche d’estimation semi paramétrique basée sur une vraisemblance pondérée et la méthode des moments généralisées et en étudions les propriétés asymptotiques et performances numériques. Une étude sur la détection des facteurs de risque de cancer VADS (voies aéro-digestives supérieures)dans la région Nord de France à l’aide de modèles spatiaux à choix binaire termine notre contribution. / This thesis is about statistical inference for spatial and/or functional data. Indeed, weare interested in estimation of unknown parameters of some models from random or nonrandom(stratified) samples composed of independent or spatially dependent variables.The specificity of the proposed methods lies in the fact that they take into considerationthe considered sample nature (stratified or spatial sample).We begin by studying data valued in a space of infinite dimension or so-called ”functionaldata”. First, we study a functional binary choice model explored in a case-controlor choice-based sample design context. The specificity of this study is that the proposedmethod takes into account the sampling scheme. We describe a conditional likelihoodfunction under the sampling distribution and a reduction of dimension strategy to definea feasible conditional maximum likelihood estimator of the model. Asymptotic propertiesof the proposed estimates as well as their application to simulated and real data are given.Secondly, we explore a functional linear autoregressive spatial model whose particularityis on the functional nature of the explanatory variable and the structure of the spatialdependence. The estimation procedure consists of reducing the infinite dimension of thefunctional variable and maximizing a quasi-likelihood function. We establish the consistencyand asymptotic normality of the estimator. The usefulness of the methodology isillustrated via simulations and an application to some real data.In the second part of the thesis, we address some estimation and prediction problemsof real random spatial variables. We start by generalizing the k-nearest neighbors method,namely k-NN, to predict a spatial process at non-observed locations using some covariates.The specificity of the proposed k-NN predictor lies in the fact that it is flexible and allowsa number of heterogeneity in the covariate. We establish the almost complete convergencewith rates of the spatial predictor whose performance is ensured by an application oversimulated and environmental data. In addition, we generalize the partially linear probitmodel of independent data to the spatial case. We use a linear process for disturbancesallowing various spatial dependencies and propose a semiparametric estimation approachbased on weighted likelihood and generalized method of moments methods. We establishthe consistency and asymptotic distribution of the proposed estimators and investigate thefinite sample performance of the estimators on simulated data. We end by an applicationof spatial binary choice models to identify UADT (Upper aerodigestive tract) cancer riskfactors in the north region of France which displays the highest rates of such cancerincidence and mortality of the country.
|
Page generated in 0.0762 seconds