Spelling suggestions: "subject:"nonparametric estatistics"" "subject:"nonparametric cstatistics""
131 |
Estimação da estrutura a termo da taxa de juros com abordagem de dados funcionaisRuas, Marcelo Castiel January 2014 (has links)
Neste trabalho, estudam-se métodos que consideram a natureza funcional da Estrutura a Termo da Taxa de Juros (ETTJ) para fazer previsões fora da amostra. São estimados modelos não-paramétricos para dados funcionais (NP-FDA) e séries temporais funcionais (FTS). O primeiro se baseia em um estimador de regressão proposto por Ferraty e Vieu (2006), que utiliza funções Kernel para atribuir pesos localmente às variáveis funcionais. Já o segundo se baseia no trabalho de Hays, Shen e Huang (2012), que estimam a ETTJ através de um modelo de fatores dinâmicos, que por sua vez são estimados através de análise de componentes principais funcional. Testa-se a capacidade de previsão dos modelos com a ETTJ americana, para os horizontes de 1, 3, 6 e 12 meses, e comparam-se os resultados com modelos benchmark, como Diebold e Li (2006) e o passeio aleatório. Principal foco deste trabalho, as estimações com métodos NP-FDA não tiveram resultado muito bons, obtendo sucesso apenas com maturidades e horizontes muito curtos. Já as estimações com FTS tiveram, no geral, desempenho melhor que os métodos escolhidos como benchmark. / This work studies methods that takes the Yield Curve's functional nature into account to produce out-of-sample forecasts. These methods are based in nonparametric functional data analysis (NP-FDA) and functional time series (FTS). The former are based in a functional regressor estimator proposed by Ferraty e Vieu (2006) that includes Kernel functions to do local weighting between the functional variables. The latter are based on the paper by Hays, Shen and Huang (2012), that forecasts the Yield Curve based in a dynamic factors model, in which the factors are determined by functional principal component analysis. Their forecasting capability is tested for the american's Yield Curve database for 1, 3, 6 and 12 months. The results from the functional methods models are then compared to benchmarks widely used in the literature, such as the random walk and the Diebold and Li (2006). Main focus on this work, the NP-FDA methods didn't produce very good forecasts, being successful only for very low maturities and short forecast horizons. The forecasts generated by the FTS methods were, in general, better than our chosen benchmarks.
|
132 |
Estimação da estrutura a termo da taxa de juros com abordagem de dados funcionaisRuas, Marcelo Castiel January 2014 (has links)
Neste trabalho, estudam-se métodos que consideram a natureza funcional da Estrutura a Termo da Taxa de Juros (ETTJ) para fazer previsões fora da amostra. São estimados modelos não-paramétricos para dados funcionais (NP-FDA) e séries temporais funcionais (FTS). O primeiro se baseia em um estimador de regressão proposto por Ferraty e Vieu (2006), que utiliza funções Kernel para atribuir pesos localmente às variáveis funcionais. Já o segundo se baseia no trabalho de Hays, Shen e Huang (2012), que estimam a ETTJ através de um modelo de fatores dinâmicos, que por sua vez são estimados através de análise de componentes principais funcional. Testa-se a capacidade de previsão dos modelos com a ETTJ americana, para os horizontes de 1, 3, 6 e 12 meses, e comparam-se os resultados com modelos benchmark, como Diebold e Li (2006) e o passeio aleatório. Principal foco deste trabalho, as estimações com métodos NP-FDA não tiveram resultado muito bons, obtendo sucesso apenas com maturidades e horizontes muito curtos. Já as estimações com FTS tiveram, no geral, desempenho melhor que os métodos escolhidos como benchmark. / This work studies methods that takes the Yield Curve's functional nature into account to produce out-of-sample forecasts. These methods are based in nonparametric functional data analysis (NP-FDA) and functional time series (FTS). The former are based in a functional regressor estimator proposed by Ferraty e Vieu (2006) that includes Kernel functions to do local weighting between the functional variables. The latter are based on the paper by Hays, Shen and Huang (2012), that forecasts the Yield Curve based in a dynamic factors model, in which the factors are determined by functional principal component analysis. Their forecasting capability is tested for the american's Yield Curve database for 1, 3, 6 and 12 months. The results from the functional methods models are then compared to benchmarks widely used in the literature, such as the random walk and the Diebold and Li (2006). Main focus on this work, the NP-FDA methods didn't produce very good forecasts, being successful only for very low maturities and short forecast horizons. The forecasts generated by the FTS methods were, in general, better than our chosen benchmarks.
|
133 |
Estimação da estrutura a termo da taxa de juros com abordagem de dados funcionaisRuas, Marcelo Castiel January 2014 (has links)
Neste trabalho, estudam-se métodos que consideram a natureza funcional da Estrutura a Termo da Taxa de Juros (ETTJ) para fazer previsões fora da amostra. São estimados modelos não-paramétricos para dados funcionais (NP-FDA) e séries temporais funcionais (FTS). O primeiro se baseia em um estimador de regressão proposto por Ferraty e Vieu (2006), que utiliza funções Kernel para atribuir pesos localmente às variáveis funcionais. Já o segundo se baseia no trabalho de Hays, Shen e Huang (2012), que estimam a ETTJ através de um modelo de fatores dinâmicos, que por sua vez são estimados através de análise de componentes principais funcional. Testa-se a capacidade de previsão dos modelos com a ETTJ americana, para os horizontes de 1, 3, 6 e 12 meses, e comparam-se os resultados com modelos benchmark, como Diebold e Li (2006) e o passeio aleatório. Principal foco deste trabalho, as estimações com métodos NP-FDA não tiveram resultado muito bons, obtendo sucesso apenas com maturidades e horizontes muito curtos. Já as estimações com FTS tiveram, no geral, desempenho melhor que os métodos escolhidos como benchmark. / This work studies methods that takes the Yield Curve's functional nature into account to produce out-of-sample forecasts. These methods are based in nonparametric functional data analysis (NP-FDA) and functional time series (FTS). The former are based in a functional regressor estimator proposed by Ferraty e Vieu (2006) that includes Kernel functions to do local weighting between the functional variables. The latter are based on the paper by Hays, Shen and Huang (2012), that forecasts the Yield Curve based in a dynamic factors model, in which the factors are determined by functional principal component analysis. Their forecasting capability is tested for the american's Yield Curve database for 1, 3, 6 and 12 months. The results from the functional methods models are then compared to benchmarks widely used in the literature, such as the random walk and the Diebold and Li (2006). Main focus on this work, the NP-FDA methods didn't produce very good forecasts, being successful only for very low maturities and short forecast horizons. The forecasts generated by the FTS methods were, in general, better than our chosen benchmarks.
|
134 |
Estimação de tipologia para dados funcionais agrupados / Tipology estimation for grouped functional dataMartarelli Filho, Angelo 04 July 2006 (has links)
Orientadores: Nancy Lopes Garcia, Ronaldo Dias / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-06T01:56:23Z (GMT). No. of bitstreams: 1
MartarelliFilho_Angelo_M.pdf: 1361524 bytes, checksum: 3ba2960a854a02d3a7cff9af920c357e (MD5)
Previous issue date: 2006 / Resumo: Neste trabalho abordamos o problema de estimação de dados funcionais quando as curvas não são observadas individualmente. Temos uma população dividida em subpopulações de tamanho conhecido, e as observações são somas de todas as observações funcionais individuais em todas as subpopulações observadas a intervalos de tempo fixos. Utilizando expansão em bases B-splines, é possível recuperar a curva média de cada subpopulação (tipologia), bem como a estrutura de variância e covariância das curvas. Estudos de simulação sugerem que o método estima bem as curvas mesmo com poucas replicações e é assintoticamente consistente. Aplicações para um problema real de curvas de carga de energia elétrica são apresentadas / Abstract: In this work we address the problem of estimating functional data when the curves are not individually observed. That is, the observations are the sum of all curves for the individuals in the population. Consider a population divided into subpopulations of known sizes. The objective of this work is to estimate the mean curve for each subpopulation (tipology) as well as the covariance structure. We propose an estimation method based on B-spIines expansion. Simulation studies suggest that the method is suitable even with few replications. Moreover, it appears to be consistent. AppIication to a real data set is presented. / Mestrado / Mestre em Estatística
|
135 |
Analise não-parametrica de dados funcionais : uma aplicação a quimiometria / Nonparametric functional data analysis applications to chemometricsSaraiva, Marley Apolinario 12 November 2009 (has links)
Orientador: Ronaldo Dias / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-14T19:32:09Z (GMT). No. of bitstreams: 1
Saraiva_MarleyApolinario_M.pdf: 2908252 bytes, checksum: 4161f517f546fb5d5dcd7a8988f11e11 (MD5)
Previous issue date: 2009 / Resumo: Devido à grande evolução dos computadores tornou-se comum coletar dados de alta dimensão. A quimiometria, que é a aplicação de métodos estatísticos e matemáticos à dados de origem química, pode ser citada como exemplo, pois nestes casos os dados são espectros que geralmente são observados em vários comprimentos de onda. O problema de como combinar estes espectros de forma ótima com o objetivo de aproximar medidas de concentrações é um problema de calibração multivariada. Em geral, esta calibração é feita com técnicas de estatística multivariada, que por sua vez, apresentam sérias dificuldades em lidar com a alta dimensão dos dados. Nesta dissertação propomos um modelo que considere as características funcionais intrínsecas deste tipo de problema, uma vez que as técnicas de estatística multivariada não consideram tais características. Algumas das técnicas de estatística multivariada mais utilizadas são de regressão linear múltipla multivariada (MLR) e regressão por mínimos quadrados parciais (PLS). Estas técnicas resumem a informação da matriz de dados, seja por escolha de quem está modelando, seja por análise de componentes principais e isto pode ocasionar perda de informa ações importantes para as análises. Devido a estas dificuldades propomos um modelo que considera o dado como ele é, uma função, e não como um dado multivariado e propomos também um modelo funcional para a estrutura de covariância. Ambos os modelos propostos utilizam a análise de dados funcionais (ADF) e por isso não apresentam as dificuldades comuns dos métodos de estatística multivariada, uma vez que a alta dimensão dos dados não é tão restritiva quanto nas técnicas multivariadas. / Abstract: With the computer evolution, the high dimension data collection has become common. The chemometrics, which is the application of statistical and mathematical methods to the chemical data, it can be an example. In these cases the data are spectra that are usually observed in several wavelengths. The problem of how to combine these spectra optimally with the goal of bringing the measurement of concentrations is a multivariate calibration problem. In general, this calibration is done with multivariate statistical techniques but there are severe difficulties in dealing with high-dimensional data. In this dissertation we propose a model that considers the intrinsic functional characteristics of this kind of problem, since the multivariate statistics techniques do not consider such features. Some of useful multivariate statistical techniques are multivariate linear regression (MLR) and partial leas squares (PLS). These techniques summarize the information of the data matrix, either by choosing who is modeling or by principal component analysis and this can cause lost of important information for analysis. Because of these difficulties we propose a model that considers the data as it is, a function, not as a multivariate data and we also propose a working model for the covariance structure. Both proposed models using functional data analysis (ADF) and therefore do not have the common difficulties of the methods of multivariate statistics, since the high-dimensional data is not as restrictive as in multivariate analysis. / Mestrado / Mestre em Estatística
|
136 |
Testes de hipoteses para dados funcionais baseados em distancias : um estudo usando splines / Distances approach to test hypothesis for functional dataSouza, Camila Pedroso Estevam de 25 April 2008 (has links)
Orientador: Ronaldo Dias / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-10T22:55:48Z (GMT). No. of bitstreams: 1
Souza_CamilaPedrosoEstevamde_M.pdf: 4239065 bytes, checksum: 099f19df22c0b40a411d07eacc2fe0d1 (MD5)
Previous issue date: 2008 / Resumo: Avanços na tecnologia moderna têm facilitado a coleta e análise de dados de alta dimensão, ou dados que são formados por medidas repetidas de um mesmo objeto. Quando os dados são registrados densamente ao longo do tempo, freqüentemente por máquinas, eles são tipicamente chamados de dados funcionais, com uma curva (ou função) observada por objeto em estudo. A análise estatística de uma amostra de n curvas como essas é comumente chamada de análise de dados funcionais, ou ADF. Conceitualmente, dados funcionais são continuamente definidos. Claro que na prática eles geralmente são observados em pontos discretos. Não há exigência para que os dados sejam suaves, mas freqüentemente a suavidade ou outra regularidade será um aspecto chave da análise, em alguns casos derivadas das funções observadas serão importantes. Nessa dissertação diferentes técnicas de suavização serão apresentadas e discutidas, principalmente aquelas baseadas em funções splines...Observação: O resumo, na íntegra, poderá ser visualizado no texto completo da tese digital / Abstract: Advances in modern technology have facilitated the collection and analysis of high-dimensional data, or data that are repeated measurements of the same subject. When the data are recorded densely over time, often by machine, they are typically termed functional or curve data, with one observed curve (or function) per subject. The statistical analysis of a sample of n such curves is commonly termed functional data analysis, or FDA. Conceptually, functional data are continuously defined. Of course, in practice they are usually observed at discrete points. There is no general requirement that the data be smooth, but often smoothness or other regularity will be a key aspect of the analysis, in some cases derivatives of the observed functions will be important. In this project different smooth techniques are presented and discussed, mainly those based on splines functions...Note: The complete abstract is available with the full electronic digital thesis or dissertations / Mestrado / Estatistica Não Parametrica / Mestre em Estatística
|
137 |
Análise de variância multivariada com a utilização de testes não -paramétricos e componentes principais baseados em matrizes de postos. / Multivariate analysis of variance using nonparametric tests and principal components based on rank matrices.Antonio Carlos Fonseca Pontes 19 July 2005 (has links)
Métodos não-paramétricos têm aplicação ampla na análise de dados, tendo em vista que não são limitados pela necessidade de imposição de distribuições populacionais específicas. O caráter multivariado de dados provenientes de estudos nas ciências do comportamento, ecológicos, experimentos agrícolas e muitos outros tipos, e o crescimento contínuo da tecnologia computacional, têm levado a um crescente interesse no uso de métodos multivariados não-paramétricos. A aplicação da análise de variância multivariada não-paramétrica é pouco inacessível ao pesquisador, exceto através de métodos aproximados baseados nos valores assintóticos da estatística de teste. Portanto, este trabalho tem por objetivo apresentar uma rotina na linguagem C que realiza testes baseados numa extensão multivariada do teste univariado de Kruskal- Wallis, usando a técnica das permutações. Para pequenas amostras, todas as configurações de tratamentos são obtidas para o cálculo do valor-p. Para grandes amostras, um número fixo de configurações aleatórias é usado, obtendo assim valores de significância aproximados. Além disso, um teste alternativo é apresentado com o uso de componentes principais baseados nas matrizes de postos. / Nonparametric methods have especially broad applications in the analysis of data since they are not bound by restrictions on the population distribution. The multivariate character of behavioural, ecological, agricultural and many other types of data and the continued improvement in computer technology have led to a sharp interest in the use of nonparametric multivariate methods in data analysis. The application of nonparametric multivariate analysis is inaccessible to applied research, except by approximation methods based on asymptotic values of the test statistic. Thus, this work aims to presenting a routine in the C language that runs multivariate tests based on a multivariate extension of the univariate Kruskal-Wallis test, using permutation technique. For small samples, all possible treatment configurations are used in order to obtain the p-value. For large samples, a fixed number of random configurations are used, obtaining an approximated significance values. In addition, another alternative test is presented using principal components based on rank matrices.
|
138 |
Estimação parametrica e semi-parametrica em misturas uniforme-beta generalizada : uma aplicação em dados de microarranjos / Parametric and semi-parametric estimation in uniform-generalized beta mixtures : application in microarray dataAbreu, Gabriel Coelho Gonçalves de 17 January 2007 (has links)
Orientador: Aluisio de Souza Pinheiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-07T20:15:26Z (GMT). No. of bitstreams: 1
Abreu_GabrielCoelhoGoncalvesde_M.pdf: 2309026 bytes, checksum: 4a857ceb54e460ea976576c36730e349 (MD5)
Previous issue date: 2007 / Resumo: A análise de dados de expressão gênica tem sido de grande importância nas mais variadas áreas do desenvolvimento humano, como agricultura, melhoramento animal e medicina. Apesar dos avanços na área de estatística genética, a análise desse tipo de dados pode ser complexa e de difícil execução. Os investimentos já feitos nos últimos anos em pesquisa laboratorial podem levar a resultados concretos (melhoramento genético, vacinas genéticas, patentes) em pouco tempo, sob a correta interpretação dos resultados. Como a análise é feita em milhares de genes, existem problemas de comparações múltiplas, excedendo substancialmente o valor nominal de cada teste. Atualmente, em biologia, o problema de testes múltiplos se tornou uma norma, e não uma excessão. Assim, soluções sugeridas englobam o controle da taxas de erro, como o FDR (False discovery rate). O estudo da distribuição empírica dos p-valores, obtidos através dos testes estatísticos, pode ser realizado sob um modelo de mistura finita de distribuições beta. Sugere-se a utilização da distribuição beta generalizada com três parâmetros, mais flexível que a beta padrão. Faz-se um estudo da estimação paramétrica e semi-paramétrica no modelo proposto. São feitos estudos de simulação e aplicação a dados reais / Abstract: The analysis of gene expression data has been of great importance in many fields of human knowledge, as agriculture, animal breeding, and medicine. Despite the continuous progress of statsitical genetics, the analysis of such data can be complex and of difficult evaluation. The investments done in the last years in laboratorial research can lead to important results in short time under the correct interpretation of data. As the analysis are done under a huge amount of data, multiple comparison problems are present, resulting in a redction of the nominal confidence of each test. Nowadays, in biologi and related fields, multiple testing problems has become a reality. Thus, among possible solutions is the control of error rates, such the FDR (False discovery rate). The estimation of the p-values distribution, obtained through statistical tests, can be evaluated by a finite mixture model of beta distributions. The use of generalized beta distribution with three parameters, a more frexible distribution, is sugested. The parametric and semi-parametric
estimations are studied over the proposed model. Simulations and a application to real data are considered. / Mestrado / Mestre em Estatística
|
139 |
Neparametrické testování nezávislosti trajektorií zvířat / Nonparametric tests of independence between animal movement trajectoriesVeselý, Martin January 2021 (has links)
In this thesis, we assume observing a pair of trajectories of two objects which could interact with one another and we want to propose a way to test their independence. We formulate basic point process definitions and discuss ways to describe trajectory data. We formulate the theory behind Monte Carlo tests and global envelope testing. In Chapter 2, we propose a parametric model to represent trajectories and derive Maximum Likelihood estimates of its model. We conclude the chapter by exploring the performance of these estimates. In Chapter 3, we propose test statistics used to test for independence using a nonparametric Monte Carlo test based on a random shift approach. We perform a simulation study to assess the performance of these statistics under various conditions and discuss the selection of fine-tuning parameters. Finally, in Chapter 4, we study real data provided by the Voyageurs Wolf Project and apply the proposed tests on real wolf trajectories. 1
|
140 |
Transformations and Bayesian Estimation of Skewed and Heavy-Tailed DensitiesBean, Andrew Taylor January 2017 (has links)
No description available.
|
Page generated in 0.0853 seconds