181 |
Inference and diagnostics in spatial modelsDE BASTIANI, Fernanda 22 February 2016 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-07-08T18:44:40Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
TESE Fernanda De Bastiani.pdf: 4258341 bytes, checksum: 8f146a8d3dfa9d213e65c7506719ad53 (MD5) / Made available in DSpace on 2016-07-08T18:44:40Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
TESE Fernanda De Bastiani.pdf: 4258341 bytes, checksum: 8f146a8d3dfa9d213e65c7506719ad53 (MD5)
Previous issue date: 2016-02-22 / FACEPE / In this work, we present inference and diagnostics in spatial models. Firstly, we extend the Gaussian spatial linear model for the elliptical spatial linear models, and present the local influence methodology to assess the sensitivity of the maximum likelihood estimators to small perturbations in the data and/or the spatial linear model assumptions. Secondly, we consider the Gaussian spatial linear models with repetitions. We obtain in matrix notation a Bartlett correction factor for the profiled likelihood ratio statistic. We also present inference approach to estimate the smooth parameter from the Mat´ern family class of models. The maximum likelihood estimators are obtained, and an explicit expression for the Fisher information matrix is also presented, even when the smooth parameter for Mat´ern class of covariance structure is estimated. We present local and global influence diagnostics techniques to assess the influence of observations on Gaussian spatial linear models with repetitions. We review concepts of Cook’s distance and generalized leverage and extend it. For local influence we consider two different approach and for both we consider appropriated perturbation in the response variable and case weight perturbation. Finally, we describe the modeling and fitting of Markov random field spatial components within the generalized additive models for locations scale and shape framework. This allows modeling any or all of the parameters of the distribution for the response variable using explanatory variables and spatial effects. We present some simulations and real data sets illustrate the methodology. / Neste trabalho, apresentamos inferência e diagnósticos para modelos espaciais. Inicialmente,
os modelos espaciais lineares Gaussianos são estendidos para os modelos espaciais
lineares elípticos, e desenvolve-se a metodologia de influência local para avaliar a sensibilidade
dos estimadores de máxima verossimilhança para pequenas perturbações nos dados
e/ou nos pressupostos do modelo. Posteriormente, considera-se os modelos espaciais lineares
Gaussianos com repetições. Para estes modelos obteve-se em notação matricial
um fator de correção de Bartlett para a estatística da razão de verossimilhanças perfiladas. E também realizada inferência para estimar o parâmetro de suavização da classe
de modelos da família Matérn. Os estimadores de máxima verossimilhança são obtidos,
e uma expressão explícita para a matriz de informação de Fisher e apresentada, mesmo
quando o parâmetro de suavização da classe de modelos da família Matérn da estrutura
de covariância _e estimado. Desenvolve-se técnicas de diagnósticos de influência local e
global para avaliar a influência de observações em modelos espaciais lineares Gaussianos
com repetições. Os conceitos de distância de Cook e alavanca generalizada são revisados
e estendidos para estes modelos. Para influência local são consideradas perturbações
apropriadas na variável resposta e ponderação de casos. Finalmente, é descrita a modelagem
para os componentes espaciais dos campos aleatórios Markovianos nos modelos
aditivos generalizados de locação escala e forma. Isto permite modelar qualquer ou todos
os parâmetros da distribuição para a variável resposta utilizando as variáveis explanatórias
e efeitos espaciais. Alguns estudos de simulações são apresentados e as metodologias são
ilustradas com conjuntos de dados reais.
|
182 |
Análise da dinâmica energética de buscas aleatóriasRIBEIRO NETO, Plínio José 30 July 2012 (has links)
Submitted by Rafael Santana (rafael.silvasantana@ufpe.br) on 2018-03-07T19:06:23Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
tese_plinio.pdf: 7758536 bytes, checksum: cb853b4bbab6ce86d639b44533c60c27 (MD5) / Made available in DSpace on 2018-03-07T19:06:23Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
tese_plinio.pdf: 7758536 bytes, checksum: cb853b4bbab6ce86d639b44533c60c27 (MD5)
Previous issue date: 2012-07-30 / CAPES, CNPQ / Neste trabalho estudamos a dinâmica energética das buscas aleatórias no contexto de encontros biológicos da procura por alimentos realizada em condições adversas, isto é, na situação em que o buscador (forager) encontra-se no limiar de extinção. Apresentaremos os princípios teóricos associados à dinâmica energética do encontro de sítios distribuídos num espaço unidimensional com condições periódicas de contorno e definiremos o modelo de busca a ser estudado. Estabeleceremos os parâmetros de ordem e os expoentes críticos da transição de fase para o estado absorvente de extinção através do estudo analítico do ganho energético médio, dos temp o s de primeira passagem pelo estado de ganho energético nulo e da taxa de sobrevivência. Através das hipóteses de escala, determinaremos numericamente os expoentes críticos associados à dinâmica energética, f3on, j3' e i/,eà dinâmica espacial, p. Exploraremos os fundamentos das classes de universalidade das transições de fases de não-equilibrio, numa perspectiva de definição de uma classe de universalidade do problema em questão distinta das classes conhecidas que apresentam um único estado absorvente. Estudaremos, ainda, o mecanismo chave de acoplamento do forager com o ambiente, e a questão de como os ambientes heterogêneos afetam a eficiência das interações de encontro sob condições de densidade global constante e escassa de recursos. Avaliaremos como as estratégias com valores superdifusivos dos expoentes de difusão surgem quando ambientes heterogêneos com ampla distribuição de distâncias iniciais entre o forager e os alvos são considerados. Por fim, mostraremos também como as flutuações estatísticas no conjunto das condições iniciais das buscas aleatórias são cruciais para a determinação de qual estratégia de busca é a ideal. / In this work we study the energetic dynamics of random searches in the context of biolo-gical encounters in environments with low density of resources, i.e. the foraging problem on the edge of extinction. We present the theoretical principles of this energetic dynamics when sites are distributed in a one-dimensional space with periodic boundary conditions and establish the model of foraging to be analyzed. We calculate the order parameter and critical exponents of the phase transition into an absorbing state of extinction through the analytical study of the mean energetic gain, the first-passage time through a state of null energetic gain, and the survival rate. We determine the critical exponents numerically by using the scaling hypothesis, such as the exponents of the energetic dynamics, f3on, j3', and v, and the exponent of space dynamics, p. We explore the basis of the universality classes of non-equilibrium phase transitions, with the aim to define the universality class of the present foraging problem as being distinct from that of known problems with a single absorbing state. We also address the general question of how the landscape he-terogeneity affects the efficiency of encounter interactions under global constant density of scarce resources. We unveil the key mechanism coupling the landscape structure with optimal search diffusivity. Finally, we show that statistical fluctuations in the set of ini-tial positions are crucial to determine which search strategy is optimal in heterogeneous landscapes.
|
183 |
Modelos de escolha discreta para dados de areaTakeyama, Ricardo Tadashi 03 August 2018 (has links)
Orientador : Emanuel Pimentel Barbosa / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-03T22:34:50Z (GMT). No. of bitstreams: 1
Takeyama_RicardoTadashi_M.pdf: 1360721 bytes, checksum: db0ea44a356740643933dde61407676d (MD5)
Previous issue date: 2004 / Mestrado / Mestre em Estatística
|
184 |
Estudo comparativo entre os metodos de Rosenblatt-Parzen e Grenander na estimação de densidadesLucambio Pérez, Fernando 01 June 1998 (has links)
Orientador: Mauro S. de Freitas Marques / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-07-23T18:30:25Z (GMT). No. of bitstreams: 1
LucambioPerez_Fernando_M.pdf: 5153199 bytes, checksum: 18886850360fae84b50bc873bd73950d (MD5)
Previous issue date: 1998 / Resumo: Desde 1890 diferentes formas de estimar uma função densidade de probabilidade têm sido propostas. Uma destas é devida a Pearson entre 1890 e 1900, e é obtida como solução de uma equação diferencial (Johnson, N. & Kotz, S., 1988). A partir de 1956 os métodos de estimação de funções de densidade de probabilidade não paramétricos têm-se consolidado como uma alternativa sofisticada ao tratamento tradicional de estudar conjuntos de dados. Esta alternativa. baseia-se na possibilidade de analisar os dados sem assumir um comportamento distribucional específico. Sobre o problema da estimação de funções de densidade de probabilidade trata o Capítulo I desta dissertação. Descrevemos também de maneira resumida algumas das propostas para obter estes estimadores e definimos propriedades estatísticas que serão estudadas nas diferentes situações consideradas. O Capítulo 11 dedica-se ao estudo de duas propostas de estimadores da função de densidade. O primeiro estimador estudado é o de Rosenblatt-Parzen. As primeiras idéias deste estimador devem-se a Rosenblatt (1956), idéias posteriormente generalizadas por Parzen (1962), obtendose o atualmente conhecido como estimador de Rosenblatt-Parzen ou "kernel". A seguir estuda-se um caso particular do estimador proposto por Grenander (1981). O estimador obtido segundo esta metodologia é conhecido como estimador de Grenander ou "sieves" de convolução. Geman & Hwang (1982) mostraram a forma do estimador de Grenander quando a densi~ade gaussiana é utilizada, na convolução, como a função núcleo. No Capítulo 111 estudamos d~mo obter a forma do estimador "sieves" de convolução em situações mais gerais de duas maneiras diferentes. Uma destas maneiras é uma generalização das idéias de Geman & Hwang (19,8'2) e a outra utiliza o modelo de dados incompletos. Estes resultados constituem a proposta teórica mais importante. Como a forma dos estimadores de Grenander obtidos através de convoluções pode ser vista como um modelo de mistura finita de densidades, realizamos no Capítulo IV um estudo do algoritmo EM para o caso particular destes modelos. Nele, apresentamos a teoria geral dos modelos de mistura de densidade e provamos que é possível utilizar o algoritmo EM na estimação de densidades segundo a proposta de Grenander no caso de convoluções, exemplificando este algoritmo quando é utilizada na convolução a densidade gaussiana. Finalmente, comparamos a performance do estimador de Grenander em relação ao estimador de Rosenblatt-Parzen, através de dados simulados para diferentes funções de densidade. Este estudo constitui o Capítulo V / Abstract: Not informed / Mestrado / Mestre em Estatística
|
185 |
Análise estatística dos dados dendrométricos do Inventário Florístico Florestal de Santa Catarina /Moser, Paolo, 1985-, Vibrans, Alexander Christian, 1959-, Universidade Regional de Blumenau. Programa de Pós-Graduação em Engenharia Florestal. January 2013 (has links) (PDF)
Orientador: Alexander Christian Vibrans. / Dissertação (mestrado) - Universidade Regional de Blumenau, Centro de Ciências Tecnológicas, Programa de Pós-Graduação de Engenharia Florestal.
|
186 |
Uma metodologia para identificação de classes de tráfego baseada em discriminantes estatísticos e análise de agrupamentosSiqueira Junior, Gabriel Paulino 25 August 2008 (has links)
Made available in DSpace on 2019-03-29T23:12:33Z (GMT). No. of bitstreams: 0
Previous issue date: 2008-08-25 / In this study, we present a methodology to identify classes of Internet traffic. This methodology is based on multivariate statistics using cluster analysis to aggregate flows into groups. To do this task, we use several statistic information collected from each data flow which are evaluated on their power of discrimination to reach a high level of accuracy on their identification. To validate this methodology, we use the peer-to-peer class. Nowadays, peer-to-peer traffic represents a significant component of the Internet traffic data meantime it is hard to identify because of the camouflage to difficult their presence in the traffic. / Neste trabalho, apresenta-se uma metodologia para identificação de classes de aplicações presentes no trafego Internet. A metodologia adotada tem como fundamento o uso da estatística multivariada, através do método de análise de agrupamentos para separar os fluxos do tráfego em grupos, utilizando para tanto diversas informações estatísticas coletadas de cada fluxo de dados, as quais são avaliadas em seu poder de discriminação para alcançar um alto índice de exatidão na identificação. Para validação da metodologia, utilizou-se a classe de aplicações peer-to-peer. Esta representa atualmente um componente significativo do total de dados que circulam na Internet sendo, entretanto, de difícil identificação, uma vez que as características de diversas aplicações peer-to-peer se camuflem para dificultar sua detecção.
Palavras-chave: Redes de Computadores; Discriminantes Estatísticos; Análise de Agrupamentos.
|
187 |
CLASTRIN - um Classificador de Tráfego de Aplicações Internet Utilizando a Abordagem "Um-Contra-Todos" / CLASTRIN - Um Classificador de Tráfego de Aplicações Internet Utilizando a Abordagem "Um-Contra-Todos" (Inglês)Carmo, Marcus Fabio Fontenelle do 28 August 2009 (has links)
Made available in DSpace on 2019-03-29T23:15:58Z (GMT). No. of bitstreams: 0
Previous issue date: 2009-08-28 / In this work, it is presented a proposal of a classifier for applications present into the Internet traffic. The purpose of this classifier is to use statistical information collected from the data flow and identify the least amount of statistical discriminators able to distinguish the flow of a determined application class from the others, separating them into groups.
To achieve this classification, the proposed method is based on split an 1 to N classification problem in N problems of classification 1 to 1 (one against all approach). The generation of data clusters is performed by cluster analysis (a method of multivariate statistics) using a non-hierarchical method (K-Means) together with techniques of supervised machine learning.
The methodology presented claims that the best set of variables to classify a given application is not the same to classify N applications. Compared to other methods, this work innovates in providing a reduction in the number of variables (features) to be analyzed by a statistical method computationally simple, which can be used in other data sets (traces). It was observed that for most classes only one variable was sufficient to discriminate the traffic of the application, getting an average of 74,40% of correct classification of flows in the class under analysis.
Keywords: Computer Networks; Statistical Discriminators; Traffic Classification; Multivariate Statistics; Cluster Analysis; Machine Learning. / Neste trabalho, apresenta-se uma proposta de um classificador de aplicações presentes no tráfego Internet. A proposta deste classificador é utilizar informações estatísticas coletadas dos fluxos de dados e identificar a menor quantidade de discriminantes estatísticos capazes de distinguir os fluxos de determinada classe de aplicação dos demais, separando-os em grupos.
Para a realização desta classificação a metodologia apresentada se baseia na divisão de um problema de classificação de 1 para N em N problemas de classificação 1 para 1 (abordagem um contra todos one-against all). A geração dos conglomerados de dados é realizada através da análise de agrupamentos (método de estatística multivariada) utilizando-se de um método não hierárquico (K-Médias K-Means) em conjunto com técnicas de aprendizagem de máquina supervisionada.
A metodologia apresentada parte do princípio que o melhor conjunto de variáveis para classificar uma determinada aplicação não é o mesmo para classificar N aplicações. Comparativamente a outros métodos estudados, este trabalho inovou ao apresentar uma redução do número de variáveis (features) a serem analisadas através de um método estatístico computacionalmente simples, que pode ser utilizado em outros conjuntos de dados (traces). Foi obtida uma média de acerto na classificação dos fluxos das classes sob análise de 74,40% e média de falsos negativos de 5,98%.
Palavras-chave: Redes de Computadores; Discriminantes Estatísticos; Classificação de Tráfego; Estatística Multivariada; Análise de Agrupamentos; Aprendizagem de Máquina.
|
188 |
Métodos de estimação do desvio-padrão para a padronização de variáveis na análise de componentes principais / Estimation methods of the standard deviation for the standardization of variables on principal components analysisGomes, Juliana Vieira 26 February 2018 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2018-04-27T14:10:41Z
No. of bitstreams: 1
texto completo.pdf: 18481185 bytes, checksum: e77f19591c9b76ec4e145021accd1625 (MD5) / Made available in DSpace on 2018-04-27T14:10:41Z (GMT). No. of bitstreams: 1
texto completo.pdf: 18481185 bytes, checksum: e77f19591c9b76ec4e145021accd1625 (MD5)
Previous issue date: 2018-02-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Este trabalho propôs avaliar a eficiência de diferentes matrizes de covariâncias sobre as estimativas dos componentes principais (CP), de acordo com diferentes métodos de estimação do desvio-padrão utilizado na padronização da variável. Além disso, procurou também, determinar a importância relativa de cada variável aleatória avaliada, normal ou não, que fez parte da composição do CP. A estimação do desvio-padrão foi feita de acordo com quatro métodos: desvio-padrão total, Lenth, Juan e Pena e Dong. Para isso, foram simulados 60 conjuntos de dados compostos por quatro variáveis aleatórias com 10.000 observações cada, com três diferentes graus de correlação, dois tipos de médias, dois tipos de variâncias e cinco percentuais de outliers. Os outliers foram adicionados com o intuito de quebrar a aleatoriedade das variáveis. De acordo com os resultados, o fator mais importante em afetar a qualidade da estimativa do desvio-padrão foi a proporção de outliers. Nesse sentido, o melhor método de estimação foi o de Lenth para até 2% de outliers. A matriz que forneceu os melhores resultados para a análise dos CPs, foi a que utilizou a estimativa do desvio-padrão obtida pelo método do desvio-padrão total, na ausência de outliers, com variâncias iguais e diferentes. Já para o conjunto de dados com outliers e variâncias iguais e diferentes, a matriz baseada no método de Lenth forneceu resultados mias satisfatórios para a análise de CPs. / This study proposed to evaluate the efficiency of different covariance matrices on the principal components (PC) estimates, according to different estimation methods of the standard deviation used in the standardization of the variable. Furthermore, this project also sought to determine the relative importance of each random variable evaluated, whether normal or not, that composed the PC. The estimation of the standard deviation was done according to four methods: total standard deviation, Lenth, Juan and Pena and Dong. For this purpose, 60 datasets were simulated containing four random variables with 10.000 observations each with three different degrees of correlation, two types of mean, two types of variances and five percentages of outliers. The outliers were added with the aim to break the randomness of the variables. According to the results, the most import fact that affects the quality of the standard deviation estimation was the proportion of outliers. In this regard, the best method of estimation was the Lenth one for up to 2% of outliers. The matrix that provided the best results for the PCs analysis was the one that utilized the estimative of the standard deviation obtained by the total standard deviation method, in the absence of outliers, with equal and different variances. As for the dataset with outliers using equal and different variances, the matrix obtained through the Lenth method provided more satisfactory results for the PCs analysis.
|
189 |
A importância do entendimento do acaso nas experiências aleatórias para o ensino e aprendizagem da probabilidade e estatística /Vargas, Saulo, 1981-, Moretto, Geraldo, 1954-, Universidade Regional de Blumenau. Programa de Pós-Graduação em Ensino de Ciências Naturais e Matemática. January 2011 (has links) (PDF)
Orientador: Geraldo Moretto. / Com: Produto educacional: Proposta de ensino: A importância do entendimento do acaso nas experiências aleatórias para o ensino e aprendizagem da probabilidade e estatística. / Dissertação (mestrado) - Universidade Regional de Blumenau, Centro de Ciências Exatas e Naturais, Programa de Pós-Graduação em Ensino de Ciências Naturais e Matemática.
|
190 |
Modelos de distribuição de riquezaCoelho, Ricardo José Loureiro January 2004 (has links)
Tese de mestrado. Faculdade de Engenharia. Universidade do Porto. 1998
|
Page generated in 0.0303 seconds