Submitted by Bruna Rodrigues (bruna92rodrigues@yahoo.com.br) on 2016-10-06T11:48:12Z
No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-20T13:58:41Z (GMT) No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-20T13:58:47Z (GMT) No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5) / Made available in DSpace on 2016-10-20T13:58:52Z (GMT). No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5)
Previous issue date: 2016-04-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / This paper presents a comparative study of the predictive power of four suitable regression
methods for situations in which data, arranged in the planning matrix, are very
poorly multicolinearity and / or high dimensionality, wherein the number of covariates is
greater the number of observations.
In this study, the methods discussed are: principal component regression, partial least
squares regression, ridge regression and LASSO.
The work includes simulations, wherein the predictive power of each of the techniques
is evaluated for di erent scenarios de ned by the number of covariates, sample size and
quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between
the methods and allowing for the creating a guide for the user to choose which method
to use based on some prior knowledge that it may have.
An application on real data (not simulated) is also addressed. / Este trabalho apresenta um estudo comparativo do poder de predi c~ao de quatro
m etodos de regress~ao adequados para situa c~oes nas quais os dados, dispostos na matriz
de planejamento, apresentam s erios problemas de multicolinearidade e/ou de alta dimensionalidade,
em que o n umero de covari aveis e maior do que o n umero de observa c~oes.
No presente trabalho, os m etodos abordados s~ao: regress~ao por componentes principais,
regress~ao por m nimos quadrados parciais, regress~ao ridge e LASSO.
O trabalho engloba simula c~oes, em que o poder preditivo de cada uma das t ecnicas e
avaliado para diferentes cen arios de nidos por n umero de covari aveis, tamanho de amostra
e quantidade e intensidade de coe cientes (efeitos) signi cativos, destacando as principais
diferen cas entre os m etodos e possibilitando a cria c~ao de um guia para que o usu ario
possa escolher qual metodologia usar com base em algum conhecimento pr evio que o
mesmo possa ter.
Uma aplica c~ao em dados reais (n~ao simulados) tamb em e abordada
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/7954 |
Date | 29 April 2016 |
Creators | Casagrande, Marcelo Henrique |
Contributors | Diniz, Carlos Alberto Ribeiro |
Publisher | Universidade Federal de São Carlos, Câmpus São Carlos, Programa de Pós-graduação em Estatística UFSCar/USP, UFSCar |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0494 seconds