• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 3
  • 3
  • 3
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

O uso da Metodologia de Dados Faltantes em Séries Temporais com Aplicação a dados de Concentração de (PM10) observados na região da Grande Vitória

PINTO, W. P. 27 August 2013 (has links)
Made available in DSpace on 2018-08-24T22:53:29Z (GMT). No. of bitstreams: 1 tese_7294_dissertação versão final apos correções da banca.pdf: 956936 bytes, checksum: 222abe412411ed3a18e6dc20128e75dd (MD5) Previous issue date: 2013-08-27 / Dados da poluic¸ ao atmosf´erica apresentam, em geral, observac¸ es faltantes. Esta pesquisa apresenta um estudo de metodologias para estimac¸ ao da func¸ ao de autocorrelac¸ ao na presenc¸a de dados faltantes, baseados no trabalho de Yajima e Nishino (1999). Contempla tamb´em algumas t´ecnicas para imputac¸ ao de dados faltantes baseadas no uso do algoritmo EM, proposto por Dempster (1977), e nos modelos de s´eries temporais ARIMA de Box e Jenkins. Ensaios de simulac¸ oes com quatro proporc¸ oes de dados faltantes foram realizadas para comparar os erros quadr´aticos m´edios dos estimadores propostos. O estudo emp´ırico evidenciou que o m´etodo de estimac¸ ao sugerido apresenta bom desempenho em termos de medidas de erro quadr´atico m´edio. Como ilustrac¸ ao da metodologia proposta, duas s´eries temporais de concentrac¸ oes de Material Particulado Inal´avel (PM10) emitida na Regiao da Grande Vit´oria, E.S., Brasil, sao analisadas.
2

Proposta de algoritmos para aumento de dados via arquétipos

CAVALCANTI, Pórtya Piscitelli 11 July 2016 (has links)
Arquétipos, na estatística, são os elementos extremos mais representativos de uma amostra ou população, a partir dos quais todos os outros podem ser reescritos. A Análise de Arquétipos (AA) é uma técnica multivariada que visa reduzir a dimensionalidade dos dados, por meio de combinações convexas dos próprios dados, proporcionando encontrar e selecionar seus arquétipos. Existem aplicações da AA em diversas áreas do conhecimento, contudo ainda não foi explorado o seu potencial no aumento de dados amostrais. Quando um conjunto de dados é caracterizado como incompleto ou não possui o tamanho necessário para cometer o erro desejado no procedimento de inferência estatística, surge a ideia, ou necessidade, de aumentar essa amostra. Para esse fim, a técnica de aumento de dados consiste em introduzir dados não observados ou variáveis latentes por meio de métodos iterativos ou algoritmos de amostragem. Sendo assim, como os arquétipos permitem reescrever os elementos amostrais com um erro mínimo, gerando elementos não observados, esses poderiam ser utilizados para o aumento de dados. Então, o objetivo deste trabalho foi propor e avaliar a eficiência do aumento de dados por meio dos arquétipos. Foram programados três algoritmos para aumento de dados amostrais via arquétipos (Algoritmos 1, 2 e 3 - A1, A2 e A3, respectivamente), e foram realizados dois estudos de simulação para avaliar e comparar cada algoritmo quanto à sua eficiência; sendo testada a distribuição da variável aleatória e as estimativas de seus parâmetros, e também para verificar se esse aumento pode ser executado sucessivas vezes. Além disso, foi feita a aplicação dos algoritmos em um conjunto de dados reais sobre análise sensorial. Os três algoritmos apresentaram resultados semelhantes, destacando-se o A3, por ter apresentado um desempenho apropriado em todos os cenários. Esse algoritmo permitiu aumentar 10% do tamanho da amostra inicial, sem alterar a distribuição de probabilidade, bem como as estimativas de seus parâmetros. O estudo sobre aumentos sucessivos de dados também indicou o A3 como o mais eficiente, que foi capaz de aumentar a amostra em 110% de seu tamanho inicial, através de 11 aumentos sucessivos de 10% cada. O estudo com dados reais permitiu aumentar o tamanho da amostra e proporcionar maior precisão na inferência praticada. Portanto, parece seguro realizar o aumento de dados via arquétipos sugerindo-se o algoritmo 3. / In statistics, archetypes are the most representative extreme observations of a sample or population, from which all others can be written. The Archetypal Analysis (AA) is a multivariate technique that aims to reduce the dimensionality of data through convex combinations of data itself, providing to find and select their archetypes. There are applications of AA in several areas of knowledge, but its potential in sample data augmentation still has not been exploited. When our data set is characterized as missing data or does not have the size needed to make the desired error in statistical inference procedure, there is the idea or need to increase this sample. For this purpose, data augmentation technique consists to introduce non observed data or latent variables by iterative methods or sampling algorithms. Thus, as archetypes allow rewriting the sample elements with a minimum error, generating elements not observed, these could be used to augment data. So the aim of this work was to propose and evaluate the efficiency of data augmentation through archetypes. Three algorithms were programmed to augment sample data using the archetypes (Algorithms 1, 2 and 3 - A1, A2 and A3, respectively), and two simulation studies were conducted to assess and compare the algorithms about the efficacy; testing the random variable distribution, and the estimatives of its parameters, and also to check whether this augment can be run successive times. In addition, was made an application of the algorithms into a real sensory analysis data. All algorithms showed similar results, highlighting the A3, that present an appropriate performance in all scenarios. This algorithm allowed to augment 10% of the initial sample size, without changing the probability distribution, as well as estimatives of its parameters. The study about successive augments also indicated A3 as the most efficient, that was able to augment the sample up to 110% of their initial size by 11 successive augments of 10%. The study with real data allowed to augment the sample size and improve the precision in practiced inference. So it seems safe to perform data augmentation by archetypes suggesting the algorithm 3.
3

Presença de dados missing em modelos de regressão logística

Ferreira, Natália Manduca 05 September 2008 (has links)
Made available in DSpace on 2016-06-02T20:06:02Z (GMT). No. of bitstreams: 1 2299.pdf: 552812 bytes, checksum: 2850eae9547732d0f7921feb333884a5 (MD5) Previous issue date: 2008-09-05 / In this work we present a detailed study of the logistic regression model with missing data in the independent variables. Several techniques are considered such as Complete Case, Mean Imputation and Corrected Complete Case. We present a new estimator, denoted EMVGM, given by the combination between the Complete Case estimator and the ML-estimator with the use of Gaussian quadrature. A simulation study is carried out to evaluate the performance of the ML-estimators obtained in each technique above mentioned. In general, the alternative estimador, EMVGM, presents a better performance taking into account the variance, the bias and the mean quadratic error. / Neste trabalho apresentamos um estudo detalhado do modelo de regressão logística na presença de valores missing nas covariáveis considerando as técnicas Caso Completo, Imputação pela Média e Caso Completo Corrigido. Um novo método, denotado EMVGM, dado pela combinação entre os estimadores de Caso Completo e os estimadores obtidos via Máxima Verossimilhança com uso da Quadratura Gaussiana, é sugerido. No desenvolvimento do estudo são realizadas simulações para a verificação do desempenho dos estimadores de máxima verossimilhança obtidos em cada técnica citada acima. A avaliação mostra que a qualidade dos parâmetros estimados obtidos por meio de cada técnica varia de acordo com o tamanho da amostra e com o número de dados missing e que, em geral, o estimador sugerido, EMVGM, apresenta os melhores estimadores levando em conta as métricas variância estimada, vício estimado e erro quadrático médio estimado.

Page generated in 0.0798 seconds