Return to search

Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)

Submitted by Bruna Rodrigues (bruna92rodrigues@yahoo.com.br) on 2016-10-06T11:48:12Z
No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-20T13:58:41Z (GMT) No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-20T13:58:47Z (GMT) No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5) / Made available in DSpace on 2016-10-20T13:58:52Z (GMT). No. of bitstreams: 1
DissMHC.pdf: 1077783 bytes, checksum: c81f777131e6de8fb219b8c34c4337df (MD5)
Previous issue date: 2016-04-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / This paper presents a comparative study of the predictive power of four suitable regression
methods for situations in which data, arranged in the planning matrix, are very
poorly multicolinearity and / or high dimensionality, wherein the number of covariates is
greater the number of observations.
In this study, the methods discussed are: principal component regression, partial least
squares regression, ridge regression and LASSO.
The work includes simulations, wherein the predictive power of each of the techniques
is evaluated for di erent scenarios de ned by the number of covariates, sample size and
quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between
the methods and allowing for the creating a guide for the user to choose which method
to use based on some prior knowledge that it may have.
An application on real data (not simulated) is also addressed. / Este trabalho apresenta um estudo comparativo do poder de predi c~ao de quatro
m etodos de regress~ao adequados para situa c~oes nas quais os dados, dispostos na matriz
de planejamento, apresentam s erios problemas de multicolinearidade e/ou de alta dimensionalidade,
em que o n umero de covari aveis e maior do que o n umero de observa c~oes.
No presente trabalho, os m etodos abordados s~ao: regress~ao por componentes principais,
regress~ao por m nimos quadrados parciais, regress~ao ridge e LASSO.
O trabalho engloba simula c~oes, em que o poder preditivo de cada uma das t ecnicas e
avaliado para diferentes cen arios de nidos por n umero de covari aveis, tamanho de amostra
e quantidade e intensidade de coe cientes (efeitos) signi cativos, destacando as principais
diferen cas entre os m etodos e possibilitando a cria c~ao de um guia para que o usu ario
possa escolher qual metodologia usar com base em algum conhecimento pr evio que o
mesmo possa ter.
Uma aplica c~ao em dados reais (n~ao simulados) tamb em e abordada

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/7954
Date29 April 2016
CreatorsCasagrande, Marcelo Henrique
ContributorsDiniz, Carlos Alberto Ribeiro
PublisherUniversidade Federal de São Carlos, Câmpus São Carlos, Programa de Pós-graduação em Estatística UFSCar/USP, UFSCar
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0027 seconds