Return to search

Algoritmo das projeções sucessivas aplicado à seleção de variáveis em regressão PLS

Made available in DSpace on 2015-05-14T13:21:12Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 4180515 bytes, checksum: c6359ed912cde60c8848929b44dcca5c (MD5)
Previous issue date: 2012-03-08 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Spectroscopy techniques combined with multivariate calibration have allowed the development of methods for analyte determinations (or other properties) in complex matrices. In this context, it can be mentioned the determinations that uses models based on PLS (Partial Least Square) regression, which is well established and consolidated in literature. Is spite of efficiency of PLS models obtained from full spectrum, some papers reported in literature show that a variable selection may improve the predictive ability of the PLS models. In the present work, it was developed an algorithm, in Matlab@, that employs the SPA (Successive Projection Algorithm), originally proposed for MLR (Multiple Linear Regression), in order to improve the predictive ability of interval PLS models. The proposed algorithm, termed iSPA-PLS, was evaluated in three case studies, namely: (i) simultaneous determination of three artificial colorants by UV-VIS spectrometry, (ii) quantification of protein contents in wheat using NIR spectrometry, and (iii) quality determination of samples of beer extract using NIR spectrometry too. The performance of iSPA-PLS was compared to the following well-established algorithms and methods: GA-PLS, PLS-Jack-Knife, iPLS e siPLS. In all applications, the results show that the iSPA-PLS presented some advantageous when compared to other algorithms used for comparison. The main advantageous include the smallest errors of prediction and the capacity of selecting a smaller number of PLS factors. / A combinação de técnicas espectroscópicas com calibração multivariada tem permitido o desenvolvimento de métodos para determinação de analitos (ou outras propriedades) em matrizes complexas. Nesse contexto, destacam-se as determinações usando modelos baseados na regressão PLS (Partial Least Square), bem difundida e consolidada na literatura. Apesar da eficácia dos modelos PLS obtidos a partir de espectros completos, alguns trabalhos da literatura têm mostrado que a seleção de variáveis pode melhorar a capacidade preditiva dos modelos PLS. No presente trabalho, desenvolve-se um algoritmo, em MatLab@, que utiliza o Algoritmo das Projeções Sucessivas-APS, proposto originalmente para MLR (Multiple Linear Regression), a fim de melhorar a capacidade preditiva de modelos PLS obtidos por intervalos. O algoritmo proposto, denominado Algoritmo das projeções sucessivas em intervalos para regressão PLS (iSPA-PLS), foi avaliado em três estudos de caso, a saber: (i) determinação simultânea de três corantes alimentícios em amostras sintéticas usando espectrometria UV-Vis, (ii) quantificação do teor de proteínas em trigo por espectrometria NIR e (iii) determinação da qualidade de amostras de extrato de cervejas usando também espectrometria NIR. O desempenho do iSPA-PLS foi comparado ao dos seguintes algoritmos e modelos bem estabelecidos na literatura: GA-PLS, PLS-Jack-Knife, iPLS e siPLS. Os resultados das três aplicações atestam as vantagens do iSPA-PLS frente aos demais algoritmos. Entre elas, destacam-se os menores erros de predição e a capacidade de selecionar um número menor de fatores PLS.

Identiferoai:union.ndltd.org:IBICT/oai:tede.biblioteca.ufpb.br:tede/7056
Date08 March 2012
CreatorsGomes, Adriano de Araújo
ContributorsSilva, Edvan Cirino da
PublisherUniversidade Federal da Paraí­ba, Programa de Pós-Graduação em Química, UFPB, BR, Química
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFPB, instname:Universidade Federal da Paraíba, instacron:UFPB
Rightsinfo:eu-repo/semantics/openAccess
Relation1435648362225100898, 600, 600, 600, 600, 9054006085480167889, 1571700325303117195, 2075167498588264571

Page generated in 0.0023 seconds