Return to search

Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas

Made available in DSpace on 2015-05-14T13:21:51Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 2432134 bytes, checksum: aeda44e0d999a92b980354a5ea66ce01 (MD5)
Previous issue date: 2010-09-22 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This study proposes a modification in the Successive Projections Algorithm
(SPA), that makes models of Multiple Linear Regression (MLR) more robust in
terms of interference. In SPA, subsets of variables are compared based on their
root mean square errors for the validation set. By taking into account the
statistical prediction error obtained for the calibration set, and dividing by the
statistical prediction error obtained for the prediction set, SPA can be improved.
Also taken into account is the leverage associated with each sample. Three case
studies involving; simulated analytic determinations, food colorants (UV-VIS
spectrometry), and ethanol in gasoline (NIR spectrometry) are discussed. The
results were evaluated using the root mean square error for an independent
prediction set (Root Mean Square Error of Prediction - RMSEP), graphs of the
variables, and the statistical tests t and F. The MLR models obtained by the
selection using the new function were called SPE-SPA-MLR. When an interferent
was present in the prediction spectra, almost all of the models performed better
than both SPA-MLR and PLS. The models when compared to SPA-MLR showed
that the change promoted better models in all cases giving smaller RMSEPs and
variable numbers. The SPE-SPA-MLR was not better in some cases, than PLS
models. The variables selected by SPA-SPE-MLR when observed in the spectra
were detected in regions where interference was the at its smallest, revealing
great potential. The modifications presented here make a useful tool for the basic
formulation of the SPA. / Este trabalho propõe uma modificação no Algoritmo das Projeções
Sucessivas (Sucessive Projection Algorithm - SPA), com objetivo de aumentar a
robustez a interferentes nos modelos de Regressão Linear Múltipla (Multiple
Linear Regression - MLR) construídos. Na formulação original do SPA,
subconjuntos de variáveis são comparados entre si com base na raiz do erro
quadrático médio obtido em um conjunto de validação. De acordo com o critério
aqui proposto, a comparação é feita também levando em conta o erro estatístico
de previsão (Statistical Prediction Error SPE) obtido para o conjunto de
calibração dividido pelo erro estatístico de previsão obtido para o conjunto de
previsão. Tal métrica leva em conta a leverage associada a cada amostra. Três
estudos de caso envolvendo a determinação de analitos simulados, corantes
alimentícios por espectrometria UV-VIS e álcool em gasolinas por espectrometria
NIR são discutidos. Os resultados são avaliados em termos da raiz do erro
quadrático médio em um conjunto de previsão independente (Root Mean Square
Error of Prediction - RMSEP), dos gráficos das variáveis selecionadas e através do
testes estatísticos t e F. Os modelos MLR obtidos a partir da seleção usando a
nova função custo foram chamados aqui de SPA-SPE-MLR. Estes modelos foram
comparados com o SPA-MLR e PLS. Os desempenhos de previsão do SPA-SPEMLR
apresentados foram melhores em quase todos os modelos construídos
quando algum interferente estava presente nos espectros de previsão. Estes
modelos quando comparados ao SPA-MLR, revelou que a mudança promoveu
melhorias em todos os casos fornecendo RMSEPs e números de variáveis
menores. O SPA-SPE-MLR só não foi melhor que alguns modelos PLS. As
variáveis selecionadas pelo SPA-SPE-MLR quando observadas nos espectros se
mostraram em regiões onde a ação do interferente foi à menor possível
revelando o grande potencial que tal mudança provocou. Desta forma a
modificação aqui apresentada pode ser considerada como uma ferramenta útil
para a formulação básica do SPA.

Identiferoai:union.ndltd.org:IBICT/oai:tede.biblioteca.ufpb.br:tede/7184
Date22 September 2010
CreatorsSoares, Sófacles Figueiredo Carreiro
ContributorsAraújo, Mário César Ugulino de, Galvão, Roberto Kawakami Harrop
PublisherUniversidade Federal da Paraí­ba, Programa de Pós-Graduação em Química, UFPB, BR, Química
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFPB, instname:Universidade Federal da Paraíba, instacron:UFPB
Rightsinfo:eu-repo/semantics/openAccess
Relation1435648362225100898, 600, 600, 600, 600, 9054006085480167889, 1571700325303117195, 2075167498588264571

Page generated in 0.0028 seconds