Return to search

Métodos de estimação do desvio-padrão para a padronização de variáveis na análise de componentes principais / Estimation methods of the standard deviation for the standardization of variables on principal components analysis

Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2018-04-27T14:10:41Z
No. of bitstreams: 1
texto completo.pdf: 18481185 bytes, checksum: e77f19591c9b76ec4e145021accd1625 (MD5) / Made available in DSpace on 2018-04-27T14:10:41Z (GMT). No. of bitstreams: 1
texto completo.pdf: 18481185 bytes, checksum: e77f19591c9b76ec4e145021accd1625 (MD5)
Previous issue date: 2018-02-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Este trabalho propôs avaliar a eficiência de diferentes matrizes de covariâncias sobre as estimativas dos componentes principais (CP), de acordo com diferentes métodos de estimação do desvio-padrão utilizado na padronização da variável. Além disso, procurou também, determinar a importância relativa de cada variável aleatória avaliada, normal ou não, que fez parte da composição do CP. A estimação do desvio-padrão foi feita de acordo com quatro métodos: desvio-padrão total, Lenth, Juan e Pena e Dong. Para isso, foram simulados 60 conjuntos de dados compostos por quatro variáveis aleatórias com 10.000 observações cada, com três diferentes graus de correlação, dois tipos de médias, dois tipos de variâncias e cinco percentuais de outliers. Os outliers foram adicionados com o intuito de quebrar a aleatoriedade das variáveis. De acordo com os resultados, o fator mais importante em afetar a qualidade da estimativa do desvio-padrão foi a proporção de outliers. Nesse sentido, o melhor método de estimação foi o de Lenth para até 2% de outliers. A matriz que forneceu os melhores resultados para a análise dos CPs, foi a que utilizou a estimativa do desvio-padrão obtida pelo método do desvio-padrão total, na ausência de outliers, com variâncias iguais e diferentes. Já para o conjunto de dados com outliers e variâncias iguais e diferentes, a matriz baseada no método de Lenth forneceu resultados mias satisfatórios para a análise de CPs. / This study proposed to evaluate the efficiency of different covariance matrices on the principal components (PC) estimates, according to different estimation methods of the standard deviation used in the standardization of the variable. Furthermore, this project also sought to determine the relative importance of each random variable evaluated, whether normal or not, that composed the PC. The estimation of the standard deviation was done according to four methods: total standard deviation, Lenth, Juan and Pena and Dong. For this purpose, 60 datasets were simulated containing four random variables with 10.000 observations each with three different degrees of correlation, two types of mean, two types of variances and five percentages of outliers. The outliers were added with the aim to break the randomness of the variables. According to the results, the most import fact that affects the quality of the standard deviation estimation was the proportion of outliers. In this regard, the best method of estimation was the Lenth one for up to 2% of outliers. The matrix that provided the best results for the PCs analysis was the one that utilized the estimative of the standard deviation obtained by the total standard deviation method, in the absence of outliers, with equal and different variances. As for the dataset with outliers using equal and different variances, the matrix obtained through the Lenth method provided more satisfactory results for the PCs analysis.

Identiferoai:union.ndltd.org:IBICT/oai:localhost:123456789/19219
Date26 February 2018
CreatorsGomes, Juliana Vieira
ContributorsRibeiro Júnior, José Ivo
PublisherUniversidade Federal de Viçosa
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFV, instname:Universidade Federal de Viçosa, instacron:UFV
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0023 seconds