Spelling suggestions: "subject:"componentes principais"" "subject:"componentes rincipais""
61 |
Espectroscopia FT-Raman no diagnóstico do carcinoma espinocelular de mucosa bucal : estudo "ex vivo" em humanos /Furuse, Cristiane Fumiko. January 2006 (has links)
Orientador: Eder Ricardo Biazolla / Coorientador: Airton Abrahão Martin / Banca: Herculano da Silva Martinho / Banca: Glauco Issamu Miyahara / Banca: Eurípedes de Oliveira Marinho / Banca: Luiz Paulo Kowalski / Resumo: O câncer é uma das doenças mais sérias que têm ameaçado a saúde e a vida e sua influência tem aumentado. Dentre os cânceres, o de boca constitui-se um grave problema de saúde pública em várias regiões do mundo, inclusive em países desenvolvidos, estando entre os 10 tipos mais comuns. A espectroscopia FT-Raman é uma ferramenta analítica moderna cujo uso no diagnóstico do câncer poderá apresentar inúmeras vantagens para os pacientes, resultados mais rápidos com o mínimo de invasibilidade. Neste estudo, foram analisados espectros FT-Raman de 81 amostras de tecido neoplásico e 48 de mucosa bucal normal, de 26 e 18 pacientes, respectivamente. Um laser Nd:YAG à 1064nm foi utilizado como fonte de excitação no FT-Raman, RFS 100/S Espectrômetro, BrukerÒ, Alemão. As biópsias foram divididas em dois fragmentos, um seguiu a rotina de procedimentos para diagnóstico. O outro foi imediatamente armazenado em tubo criogênico de 1,2 ml Nalgene® e congelado em galão de nitrogênio líquido, numa temperatura de 196ºC negativos, para preservação e manutenção de todas as estruturas teciduais. Os espectros FT-Raman obtidos foram analisados através da Análise dos Componentes Principais (PCA). A análise foi executada comparando o tecido normal com o CEC. A PCA foi usada para verificar as diferenças estatísticas na amostra. A técnica de PCA provou ser eficiente para análise, mostrando que a Espectroscopia FT-Raman apresentou resultados significativos. / Abstract: Cancer is one of the most serious diseases threatening human health and life, and the influence of this disease becomes increasing. Among the cancers, oral cancer is constituted in a serious health problem in several areas of the world even in developed countries. Globally oral cancer is one among the 10 most common cancers. FT-Raman spectroscopy is a modern analytical tool and it is believed that its use for cancer diagnosis will lead to several advantages for patients, faster results and a minimization of invasivity. In this study, were analyzed FT-Raman spectra of 81 sample of malignant human oral lesions, Squamous Cell Carcinoma (SCC) and 48 of non-diseased, of 26 and 18 patient, respectively. A Nd: YAG laser at 1064nm was used as the excitation source in the FT-Raman, RFS 100/S Spectrometer, BrukerÒ, Germany. The biopsies were divided in two fragments, one followed the routine of procedures for diagnosis. The other was stored immediately in cryogenic tube of 1,2 ml Nalgene® and frozen in gallon of liquid nitrogen, in a temperature of 196ºC negative, for preservation and maintenance of all the tissues structures. Principal Components Analysis (PCA) was applied to FT-Raman spectra of non-diseased and SCC. PCA was used to verify the statistical differences in the sample. The technique of PCA proved to be efficient for analysis, showing that FT-Raman Spectroscopy showed significant results. / Doutor
|
62 |
Previsão da curva de juros com análise de componentes principais utilizando matriz de covariâcia de longo prazo / Forecast of the interest curve with principal components analysis using long-term covariance matrixHugo Mamoru Aoki Hissanaga 25 August 2017 (has links)
Apesar da Análise de Componentes Principais (PCA) ser um dos métodos mais importantes na análise da estrutura a termo de taxa de juros, há fortes indícios de não ser adequada para estimar fatores da curva de juros quando há presença de dependência temporal e erros de medida. Para corrigir esses problemas é indicado utilizar a matriz de covariância de longo prazo, extraindo a correta estrutura de covariância presente nestes processos. Neste trabalho, mostramos que realizar a previsão fora da amostra da curva de taxa de juros com o método de Análise de Componentes Principais (PCA) utilizando como base a matriz de covarância de longo prazo (LRCM) parece ser mais acurada comparada a PCA com base na matriz de covariância amostral. / Although Principal Component Analysis (PCA) is one of the most common methods to estimate the structure of interest rate volatility, there are strong indications that it is not adequate to estimate interest rate factors when there is temporal dependence and measurement errors. To correct these problems it is necessary to use the longterm covariance matrix, to extract the correct covariance structure present in these processes. In this work, we show that performing the out-of-sample forecasting of the interest rate curve with the Principal Component Analysis (PCA) method based on the long-term covariance matrix (LRCM) seems to be more accurate compared to PCA based on sample covariance matrix.
|
63 |
Previsão da curva de juros com análise de componentes principais utilizando matriz de covariâcia de longo prazo / Forecast of the interest curve with principal components analysis using long-term covariance matrixHissanaga, Hugo Mamoru Aoki 25 August 2017 (has links)
Apesar da Análise de Componentes Principais (PCA) ser um dos métodos mais importantes na análise da estrutura a termo de taxa de juros, há fortes indícios de não ser adequada para estimar fatores da curva de juros quando há presença de dependência temporal e erros de medida. Para corrigir esses problemas é indicado utilizar a matriz de covariância de longo prazo, extraindo a correta estrutura de covariância presente nestes processos. Neste trabalho, mostramos que realizar a previsão fora da amostra da curva de taxa de juros com o método de Análise de Componentes Principais (PCA) utilizando como base a matriz de covarância de longo prazo (LRCM) parece ser mais acurada comparada a PCA com base na matriz de covariância amostral. / Although Principal Component Analysis (PCA) is one of the most common methods to estimate the structure of interest rate volatility, there are strong indications that it is not adequate to estimate interest rate factors when there is temporal dependence and measurement errors. To correct these problems it is necessary to use the longterm covariance matrix, to extract the correct covariance structure present in these processes. In this work, we show that performing the out-of-sample forecasting of the interest rate curve with the Principal Component Analysis (PCA) method based on the long-term covariance matrix (LRCM) seems to be more accurate compared to PCA based on sample covariance matrix.
|
64 |
Verificação dos efeitos das variâncias e das relações de variáveis ligadas à pecuária de leite no agrupamento dos produtores / Verification of the effects of variances and of the relationships among variables related to milk production in the grouping of dairy farmersCampana, Ana Carolina Mota 16 February 2009 (has links)
Made available in DSpace on 2015-03-26T13:32:06Z (GMT). No. of bitstreams: 1
texto completo.pdf: 358534 bytes, checksum: 24e75168f2f6257c7ffe917ef5ade7c8 (MD5)
Previous issue date: 2009-02-16 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Nowadays research often collect information on many variables from a great number of experimental units, hence produce and store large amount of data, which in turn requires methods that can handle such situations. Statistical methods such as the principal component analysis (PCA), that can reduce the dimensionality of the analysis without significant information loss, are of great interest. PCA can use either the covariance (S) or the correlation (R) matrix among variables, but the analysis may result in different Principal Components (PC) resulting from R or S. In order to indicate the best strategies for different scenarios, we conducted a simulation study to investigate the effects of variable scaling over the viability and quality of the results from PCA analysis used to cluster experimental units. In addition to this first simulation study, we also conducted a second one using animal science and economical variables from 255 dairy producers from three locations of Minas Gerais State. The goal was to verify the most appropriate data structure for cluster analysis, such that it best classifies the most economically viable producers. In both studies we used a transformation of variables based on its coefficient of variation, which resulted in a new covariance matrix named S*. Results showed that the use of matrix S favored economical variables with larger variances, while use of R matrix resulted as the most important variables the ones with larger correlations among them. Calculations of PC using matrix S* minimized these scaling problems when S and R matrices are used. Analysis using S is entirely affected by the variable scale while using R is not affected by the scale at all. We concluded that the S* matrix was the most appropriate for the present case study because it considered the most important economical variables to be the ones most related to the animal science variables. / Com o aumento substancial na quantidade de dados armazenados, surge a necessidade da utilização de métodos que permitam analisar simultaneamente várias variáveis medidas em cada elemento amostral, e ainda com a possibilidade de reduzir a dimensionalidade desse conjunto sem perda significativa de informação. Entre eles, pode-se citar o método dos componentes principais, cuja obtenção pode envolver a matriz de covariâncias (S) ou a de correlações (R) das variáveis de interesse. Como a utilização dessas matrizes pode fornecer diferentes componentes, objetivou-se investigar, por meio da simulação de dados, os efeitos das escalas das características sobre a qualidade e a viabilidade da classificação dos elementos amostrais, buscando assim, indicar estratégias de análise mais adequadas em diferentes casos. Além do estudo de simulação, foi realizado outro com variáveis zootécnicas e econômicas referentes a 255 produtores de leite de três regiões do estado de Minas Gerais, com o objetivo de verificar qual a melhor estrutura de dados em classificar de forma mais apropriada os produtores mais viáveis economicamente. Em ambos os estudos, foi efetuada uma transformação nos valores das variáveis baseada nos respectivos coeficientes de variação, cuja matriz de covariâncias foi denominada de S*. Observou-se que a utilização da matriz S privilegiou as variáveis econômicas de maiores variâncias, enquanto a matriz R considerou as variáveis mais correlacionadas entre si como as mais importantes. A obtenção dos CPs com base na matriz S* minimizou os problemas das escalas inerentes aos usos das matrizes S e R. A primeira, por considerá-la totalmente e, a segunda, por desconsiderá-la. Desta forma, considerou-se a matriz S* como a mais indicada no presente estudo de caso, uma vez que priorizou como mais importantes, as variáveis econômicas mais relacionadas às variáveis zootécnicas.
|
65 |
Avalia??o de caracter?sticas morfofuncionais de cavalos da ra?a mangalarga marchador. / Evaluation of morphofunctional traits in Mangalarga Marchador breed.Meira, Camila T?ngari 14 July 2010 (has links)
Submitted by Rodrigo Martins Cruz (rodrigo.cruz@ufvjm.edu.br) on 2015-10-26T13:23:58Z
No. of bitstreams: 2
camila_tangari_meira.pdf: 312940 bytes, checksum: a4627c11344e9979ceee55d723fadc4a (MD5)
license_rdf: 22974 bytes, checksum: 99c771d9f0b9c46790009b9874d49253 (MD5) / Approved for entry into archive by Rodrigo Martins Cruz (rodrigo.cruz@ufvjm.edu.br) on 2015-10-26T13:24:42Z (GMT) No. of bitstreams: 2
camila_tangari_meira.pdf: 312940 bytes, checksum: a4627c11344e9979ceee55d723fadc4a (MD5)
license_rdf: 22974 bytes, checksum: 99c771d9f0b9c46790009b9874d49253 (MD5) / Made available in DSpace on 2015-10-26T13:24:42Z (GMT). No. of bitstreams: 2
camila_tangari_meira.pdf: 312940 bytes, checksum: a4627c11344e9979ceee55d723fadc4a (MD5)
license_rdf: 22974 bytes, checksum: 99c771d9f0b9c46790009b9874d49253 (MD5)
Previous issue date: 2010 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / Objetivou-se com este estudo avaliar um conjunto de caracter?sticas morfofuncionais, caracter?sticas morfom?tricas e pontua??o da marcha, atrav?s da an?lise de componentes principais (ACP), e estimar os par?metros gen?ticos, para as caracter?sticas relevantes ap?s an?lise multivariada em cavalos da ra?a Mangalarga Marchador. Dados de 14288 animais, nascidos de 1990 a 2005, foram submetidos ? ACP, objetivando reduzir a dimensionalidade do conjunto de caracter?sticas. Foram consideradas as seguintes caracter?sticas: altura na cernelha, altura na garupa, comprimento da cabe?a, comprimento do pesco?o, comprimento do dorso, comprimento da garupa, comprimento da esp?dua, comprimento do corpo, largura da cabe?a, largura das ancas, per?metro do t?rax, per?metro da canela e a pontua??o da marcha. A partir desta an?lise, sugeriram-se sete vari?veis para descarte, por apresentarem maiores coeficientes de pondera??o, em valor absoluto, a partir do ?ltimo componente principal. Assim, recomendaram-se as seguintes caracter?sticas para serem mantidas em trabalhos que utilizar?o esta mesma base de dados: pontua??o da marcha (PM), altura na garupa (AG), comprimento do dorso (CD), comprimento da garupa (CG), largura da cabe?a (LC) e per?metro da canela (PC). Estas caracter?sticas foram submetidas a uma an?lise gen?tica a fim de estimar suas herdabilidades e correla??es gen?ticas e fenot?picas. Os componentes de (co)vari?ncia necess?rios ? estima??o dos par?metros gen?ticos das caracter?sticas estudadas foram estimados pelo m?todo da M?xima Verossimilhan?a Restrita (REML). O modelo animal multicaracter?stica incluiu efeito gen?tico aditivo direto de animal, como aleat?rio, e os efeitos fixos de grupos contempor?neos, al?m da covari?vel idade do animal ao registro. Altas estimativas de herdabilidade (0,66 para PM a 0,94 para CD) foram encontradas, evidenciando a possibilidade de resposta direta ? sele??o. Foram estimadas correla??es gen?ticas e fenot?picas de ausentes a moderadas magnitudes e discretas tend?ncias gen?ticas ao longo dos anos para maior parte das caracter?sticas avaliadas. / Disserta??o (Mestrado) ? Programa de P?s-Gradua??o em Zootecnia, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2010. / ABSTRACT
This study aimed to evaluate a set of morphofunctional traits, morphometric traits and marcha score data through the principal component analysis (PCA) and genetic parameters for the relevant traits in a multivariate analysis in horses Mangalarga Marchador . Data from 14,288 animals born from 1990 to 2005 were submitted to PCA aimed at reducing the dimensionality of the data set. There had been considered the following characteristics: height at withers, height at croup, lengths of head, neck, back, croup, hip length and body, widths of head, hip width, thorax perimeter, cannon bone circumference and marcha score. From this analysis, it was suggested seven variables to be discarded, because they have higher weightings (eigenvectors) in absolute value from the last major component. Based on the results, there was recommended the following characteristics to be maintained in future work: marcha score, height at croup, length of back, length of croup, width of head and cannon bone circumference. In a second step, these features were subjected to a genetic analysis to estimate their heritability?s and genetic and phenotypic correlations. The components of (co) variance needed to estimate the genetic parameters studied were estimated by Restricted Maximum Likelihood (REML). The trait animal model included direct genetic effect as random and fixed effects of contemporary groups and the covariate age record. High heritability estimates were found, suggesting the possibility of direct response to selection. Genetic and phenotypic correlation were estimate of absence to moderate magnitudes between traits and observed discrete genetic trends over the years for most traits.
|
66 |
Contribuição da mineração de dados e da otimização heurística para a interpretação dos dados da produção científica brasileiraSantos, Levi Alã Neves dos 26 August 2011 (has links)
Submitted by Duarte Zeny (zenydu@gmail.com) on 2013-01-13T13:09:21Z
No. of bitstreams: 1
Dissertação_Levi_2011.pdf: 3299266 bytes, checksum: 6f8ae17be138738ad5e24c3ea563ff0a (MD5) / Made available in DSpace on 2013-01-13T13:09:21Z (GMT). No. of bitstreams: 1
Dissertação_Levi_2011.pdf: 3299266 bytes, checksum: 6f8ae17be138738ad5e24c3ea563ff0a (MD5) / Estudo experimental com métodos de mineração de dados e de otimização heurística. Destaca a aplicação de mapas temáticos, faces de Chernoff e lógica difusa na análise de dados multivariados, possibilitando estabelecer classificação a partir de regras pré-estabelecidas, controladas. Os métodos asseguram base para planejamento, acompanhamento e análise da produção científica nacional. Tem por objetivo analisar os critérios de mensuração e apresentação dos dados sobre a produção científica nacional e descrever e aplicação da mineração de dados e da lógica difusa como métodos auxiliares na análise desses dados, através do contraste entre a demonstração de sua visualização e os métodos tradicionais. Desenvolve análise comparativa da produção por estado brasileiro e demonstra que tais métodos descrevem a produção com informações de impacto no fenômeno. Os resultados compõem técnicas de visualização de dados baseadas em representação visual de fácil associação e entendimento. Indicam a perspectiva de novas hipóteses de análise e aponta aspectos interessantes do perfil de produção brasileira. O modelo construído comprova a aplicabilidade do método, o que recomenda sua utilização pela Ciência da Informação. / Salvador
|
67 |
Análise da agricultura matogrossense, 1970/85: modernização, desconcentração da terra e mão-de-obraTarsitano, Maria Aparecida Anselmo 03 December 1990 (has links)
Made available in DSpace on 2010-04-20T20:08:32Z (GMT). No. of bitstreams: 0
Previous issue date: 1990-12-03T00:00:00Z / Com o objetivo de aprofundar o conhecimento da estrutura de produção agropecuária matogrossense, estudou-se 26 variáveis relacionadas à estrutura fundiária, uso da terra, tecnologia e capital, emprego e relações de trabalho nas 13 microrregiões homogêneas dos Estados de Mato Grosso do Sul e Mato Grosso. Através da análise fatorial pode-se observar como as características estudadas estavam correlacionadas em 1970, 75, 80 e 85, além de uma análise dinâmica para se estudar a evolução da estrutura de produção agropecuária. Todas as microrregiões apresentaram grau de modernização (maior ou menor) e uma diminuição da concentração da terra, exceção somente para a microrregião de Bodoquena (MS).
|
68 |
Caracterização potenciométrica de ácidos húmicos utilizando análise componentes principais / Potentiometric characterization of humic acids using principal components analysisFonseca, Rita Aparecida Dutra 30 March 2005 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2016-10-05T16:25:15Z
No. of bitstreams: 1
texto completo.pdf: 878205 bytes, checksum: ed399283a959570212dc039c5bdf576a (MD5) / Made available in DSpace on 2016-10-05T16:25:15Z (GMT). No. of bitstreams: 1
texto completo.pdf: 878205 bytes, checksum: ed399283a959570212dc039c5bdf576a (MD5)
Previous issue date: 2005-03-30 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A caracterização de ácidos húmicos de solos é de grande utilidade para o conhecimento das propriedades fundamentais do sistema orgânico do solo, para tal caracterização foi utilizada a técnica de titulação potenciométrica a fim de distinguir diferentes grupos funcionais e seus percentuais. As titulações potenciométricas dos ácidos húmicos com solução padronizada de NaOH 0,0959 mol L-1 em força iônica mantida constante com NaCl 0,1 mol L-1 , foram executadas em um sistema de titulação potenciométrico, com eletrodos combinados de vidro e referência de Ag/AgCl, baseado no potenciômetro ORIOM 901 interfaceado a um microcomputador. O titulante foi adicionado por bombeamento peristáltico tendo o volume e o valor de pH da solução, medidos após cada adição. Os dados adquiridos foram submetidos a um programa computacional, cujo algoritmo é baseado no método de Newton-Raphson, desenvolvido na linguagem Delphi, para obter os valores das constantes de ionização e a porcentagem dos grupos tituláveis. Este programa mostrou-se eficiente na reprodução das curvas de titulação, observando-se que a curva de ajuste coincide com a curva de titulação experimental. Após o processamento dos dados pelo programa de ajuste, foram determinados cinco grupos funcionais para os ácidos húmicos, principalmente grupos carboxílicos e fenólicos. Os parâmetros obtidos nos ajustes das curvas experimentais foram utilizados para a caracterização de ácidos húmicos de solos de setenta e duas amostras de dez locais distintos. Para o reconhecimento de padrões, utilizou-se a análise das componentes principais (PCA), para a verificação das características destas substâncias. A análise das componentes principais dos dados potenciométricos não evidenciou separação entre as amostras. Assim, as características dos ácidos húmicos evidenciadas por titulação potenciométrica refletem as condições nas quais foi formado, apesar de não possibilitar uma separação entre os grupos. Pois todas as amostras foram extraídas, fracionadas e purificadas, acarretando uma homogeneidade entre elas, não permitindo reconhecimento de padrões entre as mesmas. / The soil humic acid characterization is very useful for the knowledge of main properties of soil organic system. For that characterization was used a potentiometric titration technique aiming to separate different functional groups and their percentile. The potentiometric titrations from humic acid on standard solutions of NaOH 0.0959 molL-1 on ionic strength kept constant with NaCl 0.1 mol L-1 , were executed in a potentiometric titration system with glass electrodes and reference of Ag/AgCl, based on ORIOM 901 potentiometer interfaced to a computer. The titrant was added by a peristaltic pumping process with volume and pH solution valor measured after each addiction. The data was submitted to a computational program which the algorithm is based on the Newton- Raphson method developed in a Delphi language in order to obtain the ionization values constant and the percentile of titrable groups. This program had demonstrated as efficient on reproducing of the titration curves, observing the adjust curve coincides to the experimental titration curve. After the data processing by the adjust program it was determined five functional groups for humic acids mainly for carboxylic and phenolic groups. The parameters obtained in the experimental curve adjustments were used for the humic acid characterization of soils from 72 samples from 10 different locals. For pattern recognition it was used a principal component analysis (PCA) in order to verify the characteristic of these substances. The Principal component analysis from potentiometric data did not show a separation between the samples. The humic acid characteristics showed by the potentiometric titration demonstrate the conditions which they were formed, though it does not have the possibility of separation between the groups. So, all samples were extracted, fractionated and purified, coming up the homogeneity between them, so it did not permit the standard recognition between them.
|
69 |
Análise estatística multivariada aplicada à avaliação sensorial de alimentos / Multivariate statistical analysis applied to sensory evaluation of foodCarneiro, Joel Camilo Souza 24 November 2005 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2016-11-09T17:19:25Z
No. of bitstreams: 1
texto completo.pdf: 358209 bytes, checksum: 61f4de5dff5a2bd890da3557c1342c03 (MD5) / Made available in DSpace on 2016-11-09T17:19:25Z (GMT). No. of bitstreams: 1
texto completo.pdf: 358209 bytes, checksum: 61f4de5dff5a2bd890da3557c1342c03 (MD5)
Previous issue date: 2005-11-24 / Fundação de Amparo à Pesquisa do Estado da Bahia / Os dados experimentais obtidos por YOKOTA (2005), referentes a 14 cachaças envelhecidas, avaliadas quanto a 13 atributos sensoriais pelo método Análise Descritiva Quantitativa (ADQ), foram submetidos à análise estatística pelas técnicas multivariadas: variáveis canônicas, análise de componentes principais e análise de fatores. Apresentou-se os programas necessários para execução dos procedimentos estatísticos no sistema Statistical Analysis System (SAS) e enfatizou-se, além dos referidos procedimentos, a interpretação e discussão dos resultados. O objetivo do presente trabalho foi detalhar a aplicação das referidas técnicas multivariadas na análise de dados provenientes da avaliação sensorial descritiva. O texto desta tese foi redigido em três artigos, cada um ilustra uma das técnicas e apresenta os programas para execução das análises no SAS, independentemente. A conclusão de cada artigo relaciona os resultados obtidos com os dos outros artigos. Observou-se, pelos resultados, que as três técnicas foram eficientes, pois permitiram a redução no conjunto de informação de 13 atributos para um número bem menor de dimensões e estas retiveram a maior proporção da variância total dos dados originais. Em variáveis canônicas foram necessárias apenas duas dimensões (duas variáveis canônicas) que retiveram 91,58% da variância. Em componentes principais e análise de fatores houve a redução para quatro dimensões (componentes ou fatores) que retiveram 88,69% da variância. Foi possível, também, avaliar a importância ou influência dos atributos sobre as primeiras dimensões consideradas na caracterização e comparação entre as cachaças. Nas três análises, a primeira e a segunda dimensão foram influenciadas por atributos relacionados à madeira e ao teor alcoólico, respectivamente. Ficou, então, evidenciado que os resultados das três técnicas foram equivalentes e que o teor alcoólico e as características atribuídas pela madeira são importantes na avaliação de cachaça envelhecida. A análise por variáveis canônicas apresentou algumas vantagens em relação aos componentes principais, ou seja, as primeiras variáveis canônicas retiveram maior proporção da varAnálise estatística multivariada aplicada à avaliação sensorial de alimentosiância do que os primeiros componentes e o agrupamento entre as cachaças similares foi mais consistente. Portanto, recomenda-se que para avaliar dados obtidos por Análise Descritiva Quantitativa, em que as informações são obtidas com repetições, seja utilizada preferencialmente a análise por variáveis canônicas. Já a análise por componentes principais é mais apropriada para conjuntos de dados sem repetições, ou seja, em que há apenas uma observação por variável em cada indivíduo avaliado. A rotação efetuada na análise de fatores facilitou a interpretação dos resultados em comparação à analise de componentes principais. Porém, não se pode dizer que a análise de fatores seja melhor, pois estas técnicas não são concorrentes. Enquanto na análise de componentes principais a ênfase é explicar a variância, na análise de fatores o objetivo é tentar explicar as covariâncias. Os resultados obtidos no presente estudo foram satisfatórios para as três técnicas empregadas, o que nos leva a concluir pela recomendação do emprego de tais técnicas a outros dados também obtidos por Análise Descritiva Quantitativa, com as seguintes ressalvas: (a) aplicar variáveis canônicas e análise de fatores preferencialmente à análise de componentes principais; (b) verificar se os resultados serão satisfatórios no sentido de permitir concluir conforme o presente estudo. / This work illustrates the application of three multivariate techniques, factor analysis, principal component analysis and analysis by canonical variables, applied to sensory evaluation of food. The data used was obtained by YOKOTA (2005), who evaluated 14 commercial cachaça brands in relation to 13 sensory attributes, using Quantitative Descriptive Analysis (QDA). The programs necessary to apply the statistical procedures using the Statistical Analysis System (SAS) were presented and emphasis was given to interpretation and discussion of the results. The goal of the present work was to furnish details on how to apply these multivariate techniques to analyses data obtained from descriptive sensory evaluation of food. This thesis comprised three articles, each one illustrating one of the techniques applied and presenting the programs to run SAS analysis. The conclusion of each article provides the results presented in the other articles. The results showed that the three techniques were efficient as they allowed the reduction of 13 attributes to a smaller dimension, still retaining a large proportion of the variance from the initial dataset. Canonical variables analysis showed that only two canonical variables retained 91.58% of the total variance, while principal component analysis and factor analysis showed that only four dimensions (components or factors) retained 88.69% of the total variance. It was also possible to evaluate the importance or influence of the attributes on the first dimensions considered in the characterization and comparison of the cachaça brands. Attributes related to wood and alcoholic content, respectively, influenced the first and second dimensions in all three analyses. Results from the three techniques were equivalent in that they all showed that wood attributes and alcoholic content are important when evaluating aged cachaça. Canonical variables analysis had some advantages over the principal component analysis since the first canonical variables retained a greater proportion of the total variance than the first principal components, with the clustering of the brands into groups being more consistent. It was concluded that canonical variables analysis should be used for data with repetitions, i.e., when for each attribute, more than one observation is available per subject (cachaça brand in our study). On the other hand, principal component analysis should be used when there are no repetitions. Although principal components and factor analysis are not competing techniques, the rotation applied in factor analysis did help the interpretation of results. While in principal component analysis, emphasis is on explaining variances, in factor analysis the goal is to explain co-variances. The results obtained in the present study were satisfactory for the three techniques used. Thus, the use of these techniques to other data also obtained by Quantitative Descriptive Analysis is recommended, with the following observations: (a) canonical variables and factor analysis should be applied instead of principal component analysis; (b) verify if satisfactory results were obtained.
|
70 |
Redução dimensional dos dados de entrada em previsões de consumo industrial de energia no longo prazoSacramento, Isaac Leonardo Santos January 2014 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2014 / Made available in DSpace on 2015-02-05T20:39:52Z (GMT). No. of bitstreams: 1
329450.pdf: 550251 bytes, checksum: adffe249cd99733dc07a321d821c8e1c (MD5)
Previous issue date: 2014 / A previsão do consumo de energia elétrica no longo prazo é essencial para o planejamento do sistema de energia. O consumo de energia elétrica depende de variáveis econômicas e sociais, e a seleção destas variáveis é um dos pontos importantes na realização de previsões causais. Neste sentido, foi aplicado um método matemático com intuito de selecionar as variáveis de entrada para a previsão mensal do consumo industrial de energia usando redes neurais artificiais. O método consiste na aplicação de uma análise de componentes principais para, através da redução dimensional dos dados, reduzir os erros das previsões. As previsões obtidas com a aplicação da análise de componentes principais foram combinadas por redes neurais e comparadas às previsões obtidas selecionando-se as variáveis por análise de correlação. Uma contribuição importante deste trabalho apresenta a maior eficiência da previsão quando utilizada a ACP para selecionar variáveis para modelos de previsão por RNA, em detrimento do uso de métodos como Análise de Correlação de Pearson. A medida de erro percentual absoluto médio (MAPE) e a estatística U de Theil são utilizadas e evidenciaram a capacidade preditiva do método proposto. As previsões das redes neurais com variáveis selecionadas no primeiro componente principal, fora da amostra, foram cerca de 17;27% menor que as redes com entradas selecionadas por análise de correlação. Completando a análise, a combinação de previsões alcançou erros 38;59% menor que os erros com análise de correlação. Os resultados obtidos com os segundo e terceiro componentes principais foram, na média, maiores que os erros do método ingênuo, entretanto, tais previsões foram relevantes para a combinação de previsões.<br> / Abstract: Industrial energy consumption depends on social and economic variables, and the way these variables are selected is an important issue in causal forecasting. In this research we have applied a mathematical method in order to select the input variables for monthly forecasting of energy consumption by artificial neural networks. The method consists on applying principal component analysis to reduce dimensionality of data. The forecasts obtained by applying principal component analysis were combined by neural network and compared to the ones obtained by selecting variables through correlation analysis. An important contribution of this work is the evidence that principal component analysis reduces the number of variables in the input set and consequently the error rate of neural networks in the energy forecasting. The Mean Absolute Percentage Error (MAPE) and Theil's U statistic are used to evidence the predictive capability of the proposed method. The neural network with variables selected through the first principal component analysis has reachederrors, out of sample, around 17;27% lower than the neural nets with input variables selected by correlation analysis. In addition, the combination of forecasts has reached errors around 38;59% lower then the error obtained through correlation analysis. Completing the analysis, than neural net fed with variables selected in the second and third principal components did not reach errors lower then the naive method, however its results were relevant for the combination of forecasts.
|
Page generated in 0.0685 seconds