Spelling suggestions: "subject:"estimateur à noyau"" "subject:"estimateur à joyau""
1 |
Estimation adaptative pour des problèmes inverses avec des applications à la division cellulaire / Adaptive estimation for inverse problem with application to cell divisionHoang, Van Hà 28 November 2016 (has links)
Cette thèse se divise en deux parties indépendantes. Dans la première, nous considérons un modèle stochastique individu-centré en temps continu décrivant une population structurée par la taille. La population est représentée par une mesure ponctuelle évoluant suivant un processus aléatoire déterministe par morceaux. Nous étudions ici l'estimation non-paramétrique du noyau régissant les divisions, sous deux schémas d'observation différents. Premièrement, dans le cas où nous obtenons l'arbre entier des divisions, nous construisons un estimateur à noyau avec une sélection adaptative de fenêtre dépendante des données. Nous obtenons une inégalité oracle et des vitesses de convergence exponentielles optimales. Deuxièmement, dans le cas où l'arbre de division n'est pas complètement observé, nous montrons que le processus microscopique renormalisé décrivant l'évolution de la population converge vers la solution faible d'une équation aux dérivés partielles. Nous proposons un estimateur du noyau de division en utilisant des techniques de Fourier. Nous montrons la consistance de l'estimateur. Dans la seconde partie, nous considérons le modèle de régression non-paramétrique avec erreurs sur les variables dans le contexte multidimensionnel. Notre objectif est d'estimer la fonction de régression multivariée inconnue. Nous proposons un estimateur adaptatif basé sur des noyaux de projection fondés sur une base d'ondelettes multi-index et sur un opérateur de déconvolution. Le niveau de résolution des ondelettes est obtenu par la méthode de Goldenshluger-Lepski. Nous obtenons une inégalité oracle et des vitesses de convergence optimales sur les espaces de Hölder anisotropes. / This thesis is divided into two independent parts. In the first one, we consider a stochastic individual-based model in continuous time to describe a size-structured population for cell divisions. The random point measure describing the cell population evolves as a piecewise deterministic Markov process. We address here the problem of nonparametric estimation of the kernel ruling the divisions, under two observation schemes. First, we observe the evolution of cells up to a fixed time T and we obtain the whole division tree. We construct an adaptive kernel estimator of the division kernel with a fully data-driven bandwidth selection. We obtain an oracle inequality and optimal exponential rates of convergence. Second, when the whole division tree is not completely observed, we show that, in a large population limit, the renormalized microscopic process describing the evolution of cells converges to the weak solution of a partial differential equation. We propose an estimator of the division kernel by using Fourier techniques. We prove the consistency of the estimator. In the second part, we consider the nonparametric regression with errors-in-variables model in the multidimensional setting. We estimate the multivariate regression function by an adaptive estimator based on projection kernels defined with multi-indexed wavelets and a deconvolution operator. The wavelet level resolution is selected by the method of Goldenshluger-Lepski. We obtain an oracle inequality and optimal rates of convergence over anisotropic Hölder classes.
|
2 |
Contribution à l’économétrie spatiale et l’analyse de données fonctionnelles / Contribution to spatial econometric and functional data analysisGharbi, Zied 24 June 2019 (has links)
Ce mémoire de thèse touche deux champs de recherche importants en statistique inférentielle, notamment l’économétrie spatiale et l’analyse de données fonctionnelles. Plus précisément, nous nous sommes intéressés à l’analyse de données réelles spatiales ou spatio-fonctionnelles en étendant certaines méthodes inférentielles pour prendre en compte une éventuelle dépendance spatiale. Nous avons d’abord considéré l’estimation d’un modèle autorégressif spatiale (SAR) ayant une variable dépendante fonctionnelle et une variable réponse réelle à l’aide d’observations sur une unité géographique donnée. Il s’agit d’un modèle de régression avec la spécificité que chaque observation de la variable indépendante collectée dans un emplacement géographique dépend d’observations de la même variable dans des emplacements voisins. Cette relation entre voisins est généralement mesurée par une matrice carrée nommée matrice de pondération spatiale et qui mesure l’effet d’interaction entre les unités spatiales voisines. Cette matrice est supposée exogène c’est-à-dire la métrique utilisée pour la construire ne dépend pas des mesures de variables explicatives du modèle. L’apport de cette thèse sur ce modèle réside dans le fait que la variable explicative est de nature fonctionnelle, à valeurs dans un espace de dimension infinie. Notre méthodologie d’estimation est basée sur une réduction de la dimension de la variable explicative fonctionnelle, par l’analyse en composantes principales fonctionnelles suivie d’une maximisation de la vraisemblance tronquée du modèle. Des propriétés asymptotiques des estimateurs, des illustrations des performances des estimateurs via une étude de Monte Carlo et une application à des données réelles environnementales ont été considérées. Dans la deuxième contribution, nous reprenons le modèle SAR fonctionnel étudié dans la première partie en considérant une structure endogène de la matrice de pondération spatiale. Au lieu de se baser sur un critère géographique pour calculer les dépendances entre localisations voisines, nous calculons ces dernières via un processus endogène, c’est-à-dire qui dépend des variables à expliquées. Nous appliquons la même approche d’estimation à deux étapes décrite ci-dessus, nous étudions aussi les performances de l’estimateur proposé pour des échantillons à taille finie et discutons le cadre asymptotique. Dans la troisième partie de cette contribution, nous nous intéressons à l’hétéroscédasticité dans les modèles partiellement linéaires pour variables exogènes réelles et variable réponse binaire. Nous proposons un modèle Probit spatial contenant une partie non-paramétrique. La dépendance spatiale est introduite au niveau des erreurs (perturbations) du modèle considéré. L’estimation des parties paramétrique et non paramétrique du modèle est récursive et consiste à fixer d’abord les composants paramétriques et à estimer la partie non paramétrique à l’aide de la méthode de vraisemblance pondérée puis utiliser cette dernière estimation pour construire un profil de la vraisemblance pour estimer la partie paramétrique. La performance de la méthode proposée est étudiée via une étude Monte Carlo. La contribution finit par une étude empirique sur la relation entre la croissance économique et la qualité environnementale en Suède à l’aide d’outils de l’économétrie spatiale. / This thesis covers two important fields of research in inferential statistics, namely spatial econometrics and functional data analysis. More precisely, we have focused on the analysis of real spatial or spatio-functional data by extending certain inferential methods to take into account a possible spatial dependence. We first considered the estimation of a spatial autoregressive model (SAR) with a functional dependent variable and a real response variable using observations on a given geographical unit. This is a regression model with the specificity that each observation of the independent variable collected in a geographical location depends on observations of the same variable in neighboring locations. This relationship between neighbors is generally measured by a square matrix called the spatial weighting matrix, which measures the interaction effect between neighboring spatial units. This matrix is assumed to be exogenous, i.e. the metric used to construct it does not depend on the explanatory variable. The contribution of this thesis to this model lies in the fact that the explanatory variable is of a functional nature, with values in a space of infinite dimension. Our estimation methodology is based on a dimension reduction of the functional explanatory variable through functional principal component analysis followed by maximization of the truncated likelihood of the model. Asymptotic properties of the estimators, illustrations of the performance of the estimators via a Monte Carlo study and an application to real environmental data were considered. In the second contribution, we use the functional SAR model studied in the first part by considering an endogenous structure of the spatial weighting matrix. Instead of using a geographical criterion to calculate the dependencies between neighboring locations, we calculate them via an endogenous process, i.e. one that depends on explanatory variables. We apply the same two-step estimation approach described above and study the performance of the proposed estimator for finite or infinite-tending samples. In the third part of this thesis we focus on heteroskedasticity in partially linear models for real exogenous variables and binary response variable. We propose a spatial Probit model containing a non-parametric part. Spatial dependence is introduced at the level of errors (perturbations) of the model considered. The estimation of the parametric and non-parametric parts of the model is recursive and consists of first setting the parametric parameters and estimating the non-parametric part using the weighted likelihood method and then using the latter estimate to construct a likelihood profile to estimate the parametric part. The performance of the proposed method is investigated via a Monte-Carlo study. An empirical study on the relationship between economic growth and environmental quality in Sweden using some spatial econometric tools finishes the document.
|
3 |
Estimation récursive de fonctionnellesThiam, Baba 05 December 2006 (has links) (PDF)
L'objet de cette thèse est l'étude du comportement asymptotique d'estimateurs à noyau d'une densité de probabilité et de ses dérivées, d'une fonction de régression, ainsi que du mode et de la valeur modale d'une densité de probabilité. Le but est d'établir certaines propriétés des estimateurs à noyau récursifs ou semi-récursifs afin de comparer leur comportement asymptotique à celui des estimateurs classiques. Dans le premier chapitre, nous établissons des principes de grandes déviations (PGD) et des principes de déviations modérées (PDM) pour l'estimateur récursif d'une densité de probabilité et pour ses dérivées. Il s'avére que, dans les principes de déviations vérifiés par les estimateurs des dérivées, la fonction de taux est toujours une fonction quadratique, que les déviations soient grandes ou modérées. Contrairement, pour l'estimateur de la densité, les fonctions de taux qui apparaissent sont de nature différente selon que les déviations sont grandes ou modéerées. Les fonctions de taux qui apparaissent tant dans les PGD pour les dérivées que dans les PDM pour la densité et pour les dérivées sont plus grandes dans le cas où l'estimateur récursif est utilisé. Dans le deuxième chapitre, nous établissons des PGD et des PDM pour des estimateurs à noyau d'une fonction de régression. Nous généralisons les résultats déjà obtenus dans le cas unidimensionnel pour l'estimateur de Nadaraya-Watson. Nous étudions ensuite le comportement en déviations de la version semi-récursive de cet estimateur en établissant des PGD et des PDM. Les fonctions de taux qui apparaissent dans les PDM sont plus grandes pour l'estimateur semi-récursif que pour l'estimateur classique. Dans le troisième chapitre, nous nous intéressons à l'estimation jointe du mode et de la valeur modale d'une densité de probabilité basée sur l'estimateur à noyau récursif de la densité. Nous étudions la vitesse de convergence en loi et presque sûre du couple formé par ces deux estimateurs. Pour estimer simultanément les deux paramètres de façon optimale, il faut utiliser des fenêtres différentes pour définir chacun des deux estimateurs. Les estimateurs semi-récursifs conduisent à des variances asymptotiques plus petites que les estimateurs classiques.
|
4 |
Estimation non paramétrique pour des modèles de diffusion et de régressionBrua, Jean-Yves 17 November 2008 (has links) (PDF)
Nous considérons le problème de l'estimation d'une fonction inconnue en un point fixe à l'aide de données régies par des modèles de régression ou de diffusion. Pour définir le risque associé à l'emploi d'un estimateur et ainsi mesurer la qualité de celui-ci, nous utilisons la fonction de perte liée à l'erreur absolue. Le travail de cette thèse suit l'approche minimax dont l'objectif est de trouver une borne inférieure asymptotique du risque minimax puis de construire un estimateur, dit asymptotiquement efficace, dont le risque maximal atteint asymptotiquement cette borne.<br />Pour un modèle de régression non paramétrique et hétéroscédastique, où l'écart-type du bruit dépend à la fois du régresseur et de la fonction de régression supposée appartenir à une classe höldérienne faible de régularité connue, nous montrons qu'un estimateur à noyau est asymptotiquement efficace. Lorsque la régularité de la fonction de régression est inconnue, nous obtenons la vitesse de convergence minimax adaptative des estimateurs sur une famille de classes höldériennes. Enfin, pour un modèle de diffusion où la dérive appartient à un voisinage höldérien faible centré en une fonction lipschitzienne, nous présentons la construction d'un estimateur à noyau asymptotiquement efficace.
|
5 |
Grandes déviations pour les estimateurs à noyau de la densité et étude de l'estimateur de décrément aléatoireLei, Liangzhen 09 December 2005 (has links) (PDF)
Cette thèse est consacrée à l'étude de deux thèmes : les grandes déviations pour les estimateurs à noyau de la densité $f_n^*$ des processus stochastiques stationnaires et l'estimateur de décrément aléatoire (EDA) pour les processus gaussiens stationnaires.<br /><br /><br />Le premier thème est la partie principale de cette thèse, constituées des quatre premiers chapitres. Dans le chapitre 1, on établit le w*-PGD(principe de grandes déviations) de $f_n^*$ et une inégalité de concentration dans le cas i.i.d.. On démontre dans le chapitre 2 la convergence exponentielle de $f_n^*$ dans $L^1(R^d)$ et une inégalité de concentration pour des suites $\phi$-mélangeants, en se basant sur une inégalité de tranport de Rio. Les chapitre 3 et 4 constituent le coeur de cette thèse : on établit (i) le PGD de $f_n^*$ pour la topologie faible $\sigma(L^1, L^{\infty})$ ; (ii) le w*-PGD de $f_n^*$ dans $L^1$ pour la topologie forte $\vert\cdot\vert_1$ ; (iii) l'estimation de grandes déviations pour l'erreur $D_n^*=\vert f_n^*(x)-f(x) \vert_1$ et (iv) l'optimalité asymptotique de $f_n^*$ au sens de Bahadur. Ces résultats sont prouvés dans le chapitre 3 pour des processus de Markov uniformément ergodiques et dans le chapitre 4 pour des processus de Markov réversibles uniformément intégrables.<br /><br /><br />Le dernier chapitre est consacré au second thème. On démontre la loi des grands nombres et le théorème de limite centrale pour l'EDA à temps discret et on établit pour la première fois l'expression explicite du biais de l'EDA à temps continu.
|
6 |
Estimation non paramétrique pour les modèles autorégressifsArkoun, Ouerdia 09 November 2009 (has links) (PDF)
Cette thèse se consacre à l'estimation non paramétrique pour les modèles autorégressifs. Nous considérons le problème de l'estimation d'une fonction inconnue en un point fixe à l'aide de données régies par des modèles autorégressifs. Pour définir le risque associé à l'emploi d'un estimateur et ainsi mesurer la qualité de celui-ci, nous utilisons la fonction de perte liée à l'erreur absolue. Le travail de cette thèse suit l'approche minimax dont l'objectif est de trouver une borne inférieure asymptotique du risque minimax puis de construire un estimateur, dit asymptotiquement efficace, dont le risque maximal atteint asymptotiquement cette borne. Pour un modèle autorégressif non paramétrique où la fonction autorégressive est supposée appartenir à une classe H\"{o}ldérienne faible de régularité connue, nous montrons qu'un estimateur à noyau est asymptotiquement efficace. Lorsque la régularité de la fonction autorégressive est inconnue, nous obtenons la vitesse de convergence minimax adaptative des estimateurs sur une famille de classes H\"{o}ldériennes.\\
|
7 |
Estimation non-paramétrique des quantiles extrêmes conditionnelsLekina, Alexandre 13 October 2010 (has links) (PDF)
L'objectif de ce travail est de proposer de nouveaux estimateurs de quantiles extrêmes dans le cadre conditionnel c'est-à-dire dans la situation où la variable d'intérêt Y, supposée aléatoire et réelle, est mesurée simultanément avec une covariable X. Pour ce faire, nous nous intéressons à l'étude des valeurs extrêmes d'un échantillon d'observations indépendantes dont la loi conditionnelle de Y en un point x de la covariable X est à " queue lourde ". Selon la nature de la covariable, nous considérons deux situations. Primo, lorsque la covariable est déterministe et de dimension finie ou infinie (i.e covariable fonctionnelle), nous proposons d'estimer les quantiles extrêmes par la méthode dite de la " fenêtre mobile ". La loi limite des estimateurs ainsi construits est ensuite donnée en fonction de la vitesse de convergence de l'ordre du quantile vers un. Secundo, lorsque la covariable est aléatoire et de dimension finie, nous montrons que sous certaines conditions, il est possible d'estimer les quantiles extrêmes conditionnels au moyen d'un estimateur à " noyau " de la fonction de survie conditionnelle. Ce résultat nous permet d'introduire deux versions lisses de l'estimateur de l'indice de queue conditionnel indispensable lorsque l'on veut extrapoler. Nous établissons la loi asymptotique de ces estimateurs. Par ailleurs, nous considérons le cas sans covariable (non conditionnel) lorsque la fonction de répartition est à " queue lourde ". Nous proposons et étudions un nouvel estimateur des quantiles extrêmes. Afin d'apprécier le comportement de nos nouveaux outils statistiques, des résultats sur simulation ainsi que sur des données réelles sont présentés.
|
8 |
Estimations paramétriques et non-paramétriques pour des modèles de diffusions périodiques / Parametric and not - parametric estimations for models of periodic distributionsEl Waled, Khalil 25 November 2015 (has links)
Cette thèse est consacrée au problème d'estimation de la fonction de dérive de certains modèles de processus stochastiques périodiques lorsque la durée d'observation tend vers l'infini. Aucune hypothèse de récurrence n'est posée a priori.Dans un premier temps nous considérons le modèle du type signal plus bruit dζt = f (t, θ)dt + σ(t)dWt,; et puis nous étudions l'estimation du paramètre θ à partir d'une observation continue et puis d'une observation discrète du processus {ζt} sur l'intervalle [0; T]. Les fonctions f (·, ·) et σ(·) sont continues et périodiques en t de même période P > 0, σ(·) > 0 et θ ∈ Θ ⊂R. Nous établissons la convergence en probabilité d'un estimateur du maximum de vraisemblance θˆT , sa normalité asymptotique et son efficacité asymptotique minimax. Lorsque f (t, θ) = θf (t), l'expression de θˆT est explicite et nous obtenons la convergence en moyenne quadratique aussi bien pour le cas d'une observation continue que pour le cas d'une observation discrète. De plus, nous déduisons la convergence presque sûre dans le cas d'une observation continue.Dans la seconde partie nous traitons l'estimation non-paramétrique de la fonction f(_) pour les modèles périodiques du type signal plus bruit et du type Ornstein-Uhlenbeck donnés par dζt = f (t)dt + σ(t)dWt, dξt = f (t)ξtdt + dWt. Pour le premier modèle, un estimateur à noyau périodique est construit, la convergence en moyenne quadratique uniformément sur [0; P] et presque sûre de cet estimateur est établie ainsi que sa normalité asymptotique. Dans le cas du modèle d'Ornstein-Uhlenbeck, la convergence du biais ainsi que la convergence en moyenne quadratique uniformément sur [0; P] sont prouvées, et leurs vitesses de convergence sont étudiées. / In this thesis, we consider a drift estimation problem of a certain class of stochastic periodic processes when the length of observation goes to infinity. Firstly, we deal with the linear periodic signal plus noise model dζt = f (t, θ)dt + σ(t)dWt, ;and we study the parametric estimation from a continuous and discrete observation of the process f_tg throughout the interval [0; T]. Using the maximum likelihood method we show the existence of an estimator θˆT which is consistent, asymptotically normal and asymptotically efficient in the sens minimax. When f(t; _) = _f(t), the expression of ^_T is explicit and we obtain the mean square convergence in the both continuous and discrete observation cases. In addition, we deduce the strong consistency in the case of continuous observation.Secondly, we consider the nonparametric estimation problem of the function f(_) for the next two periodic models of type signal plus noise and Ornstein-Uhlenbeckd_t = f(t)dt + _(t)dWt; d_t = f(t)_tdt + dWt:For the signal plus noise model, we build a kernel estimator, the convergence in mean square uniformly over [0; P] and almost sure convergence are established, as well as the asymptotic normality. For the Ornstein-Uhlenbeck model, we prove the convergence uniformly over [0; P] of the bias and the mean square convergence. Moreover, we study the speed of these convergences.
|
9 |
Quelques propriétés asymptotiques en estimation non paramétrique de fonctionnelles de processus stationnaires en temps continu / Some asymptotic properties for nonparametric estimation of functional of stationary continuous time processesDidi, Sultana 15 September 2014 (has links)
Les travaux de cette thèse portent sur les problèmes d’estimation non paramétrique des fonctions de densité, de régression et du mode conditionnel associés à des processus stationnaires à temps continu. La motivation essentielle est d’établir des propriétés asymptotiques tout en considérant un cadre de dépendance des données assez général qui puisse être facilement utilisé en pratique. Cette contribution se compose de quatre parties. La première partie est consacrée à l’état de l’art relatif à la problématique qui situe bien notre contribution dans la littérature. Dans le deuxième partie, nous nous intéressons à l’estimation, par la méthode du noyau, de la densité pour laquelle nous établissons des résultats de convergence presque sûre, ponctuelle et uniforme, avec des vitesses de convergence. Dans les parties suivantes, les données sont supposées stationnaires et ergodiques. Dans la troisième partie, des propriétés asymptotiques similaires sont établies pour l’estimation à noyau de la fonction de régression. Dans le même esprit, nous étudions dans la quatrième partie, l’estimation à noyau de la fonction mode conditionnel pour lequel nous établissons des propriétés de consistance avec des vitesses de convergence. L’estimateur proposé ici se positionne comme une alternative à celui de la fonction de régression dans les problèmes de prévision. / The work of this thesis focuses upon some nonparametric estimation problems. More precisely, considering kernel estimators of the density, the regression and the conditional mode functions associated to a stationary continuous-time process, we aim at establishing some asymptotic properties while taking a sufficiently general dependency framework for the data as to be easily used in practice. The present manuscript includes four parts. The first one gives the state of the art related to the field of our concern and identifies well our contribution as compared to the existing results in the literature. In the second part, we focus on the kernel density estimation. In a rather general dependency setting, where we use a martingale difference device and a technique based on a sequence of projections on -fields, we establish the almost sure pointwise and uniform consistencies with rates of our estimate. In the third part, similar asymptotic properties are established for the kernel estimator of the regression function. Here and below, the processes are assumed to be ergodic In the same spirit, we study in the fourth part, the kernel estimate of conditional mode function for which we establish consistency properties with rates of convergence. The proposed estimator may be viewed as an alternative in the prediction issues to the usual regression function.
|
10 |
Estimation de densité en dimension élevée et classification de courbesRouvière, Laurent 18 November 2005 (has links) (PDF)
L'objectif de cette thèse consiste étudier et approfondir des techniques d'estimation de la densité et de classification dans des espaces de dimension élevée. Nous avons choisi de structurer notre travail en trois parties.<br /><br />La première partie, intitulée compléments sur les histogrammes modifiés, est composée de deux chapitres consacrés l'étude d'une famille d'estimateurs non paramétriques de la densité, les histogrammes modifiés, connus pour posséder de bonnes propriétés de convergence au sens des critères de la théorie de l'information. Dans le premier chapitre, ces estimateurs sont envisagés comme des systèmes dynamiques espace d'états de dimension infinie. Le second chapitre est consacré l'étude de ces estimateurs pour des dimensions suprieures un.<br /><br />La deuxième partie de la thèse, intituleé méthodes combinatoires en estimation de la densité, se divise en deux chapitres. Nous nous intéressons dans cette partie aux performances distance finie d'estimateurs de la densité sélectionnés à l'intérieur d'une famille d'estimateurs candidats, dont le cardinal n'est pas nécessairement fini. Dans le premier chapitre, nous étudions les performances de ces méthodes dans le cadre de la sélection des différents paramètres des histogrammes modifiés. Nous poursuivons, dans le deuxième chapitre, par la sélection d'estimateurs à noyau dont le paramètre de lissage s'adapte localement au point d'estimation et aux données.<br /><br />Enfin, la troisième et dernière partie, plus appliquée et indépendante des précédentes, présente une nouvelle méthode permettant de classer des courbes partir d'une décomposition des observations dans des bases d'ondelettes.
|
Page generated in 0.2673 seconds