Return to search

Desenvolvimento de t?cnicas de classifica??o supervisionada para dados qu?micos multivariados / Development of supervised classification techniques for multivariate chemical data

Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-11-01T21:32:48Z
No. of bitstreams: 1
CamiloDeLelisMedeirosDeMorais_DISSERT.pdf: 7776134 bytes, checksum: df3df5fbaaa77afcd7e4306d1584bec9 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-11-07T23:52:52Z (GMT) No. of bitstreams: 1
CamiloDeLelisMedeirosDeMorais_DISSERT.pdf: 7776134 bytes, checksum: df3df5fbaaa77afcd7e4306d1584bec9 (MD5) / Made available in DSpace on 2017-11-07T23:52:52Z (GMT). No. of bitstreams: 1
CamiloDeLelisMedeirosDeMorais_DISSERT.pdf: 7776134 bytes, checksum: df3df5fbaaa77afcd7e4306d1584bec9 (MD5)
Previous issue date: 2017-09-29 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / Esta disserta??o consiste de um aporte te?rico sobre a constru??o de t?cnicas de classifica??o
supervisionada para aplica??es em dados qu?micos multivariados. Para isso, t?cnicas
quimiom?tricas baseadas em an?lise discriminante quadr?tica (QDA) e m?quinas de vetores
suporte (SVM) foram constru?das em conjunto com an?lise de componentes principais (PCA),
algoritmo de proje??es sucessivas (SPA) e algoritmo gen?tico (GA) para classifica??o
supervisionada utilizando redu??o de dados e sele??o de vari?veis. Essas t?cnicas foram
empregadas na an?lise de dados de primeira ordem, constitu?dos de espectros na regi?o do
infravermelho m?dio com transformada de Fourier e reflect?ncia total atenuada (ATR-FTIR);
espectros de massas obtidos por cromatografia l?quida com um detector por tempo de v?o
(LC/TOF); e espectros de massas obtidos por desor??o/ioniza??o por laser de superf?cie
acoplado a um detector por tempo de v?o (SELDI-TOF). Os dados de ATR-FTIR foram
utilizados para diferenciar duas classes de fungos do g?nero Cryptococcus, enquanto que os
dados de espectrometria de massas foram utilizados para identificar c?ncer de ov?rio e de
pr?stata em soro sangu?neo. Al?m disso, novas t?cnicas de an?lise discriminante
bidimensionais utilizando an?lise de componentes principais com an?lise discriminante linear
(2D-PCA-LDA), an?lise discriminante quadr?tica (2D-PCA-QDA) e m?quinas de vetores
suporte (2D-PCA-SVM) foram desenvolvidas para aplica??es em dados qu?micos de segunda
ordem compostos por matrizes de excita??o-emiss?o (EEM) por fluoresc?ncia molecular em
amostras simuladas e reais. Os resultados obtidos mostraram que as t?cnicas desenvolvidas
tiveram alto desempenho classificat?rio tanto para os dados de primeira quanto de segunda
ordem, com taxas de acerto, sensibilidade e especificidade atingindo valores entre 90 a 100%.
Al?m disso, as t?cnicas bidimensionais desenvolvidas tiveram, no geral, desempenho superior
do que os m?todos tradicionais de classifica??o multivariada utilizando dados desdobrados, o
que mostra seu potencial para outras futuras aplica??es anal?ticas. / This dissertation is composed by a theoretical contribution about the development of supervised
classification techniques for application using multivariate chemical data. For this,
chemometric techniques based on quadratic discriminant analysis (QDA) and support vector
machines (SVM) were built combined with principal component analysis (PCA), successive
projections algorithm (SPA) and genetic algorithm (GA) for supervised classification using
data reduction and feature selection. These techniques were employed in analyzing first-order
data, composed by attenuated total reflectance Fourier transform infrared spectroscopy (ATRFTIR)
and mass spectra obtained from liquid chromatography time of flight (LC/TOF) and
surface-enhanced laser desorption/ionization time of flight (SELDI/TOF). ATR-FTIR data
were used to differentiate two classes of fungus of Cryptococcus gene, whereas the mass spectra
data was used to identify ovarian and prostate cancer in blood serum. In addition, new twodimensional
discriminant analysis techniques based on principal component analysis linear
discriminant analysis (2D-PCA-LDA), quadratic discriminant analysis (2D-PCA-QDA) and
support vectors machine (2D-PCA-SVM) were developed for applications in second-order
chemical data composed by excitation-emission matrices (EEM) molecular fluorescence of
simulated and real samples. The results show that the developed techniques had better
classification performance for both first and second-order data, with classification rates,
sensitivity and specificity reaching values between 90 to 100%. Also, the developed twodimensional
techniques had overall performance superior than traditional multivariate
classification methods using unfolded data, showing its potential to other future analytical
applications.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufrn.br:123456789/24217
Date29 September 2017
CreatorsMorais, Camilo de Lelis Medeiros de
Contributors03144855464, Moraes, Edgar Perin, 13563054827, Menezes, Fabricio Gava, 03114939988, Bruns, Roy Eduard, 45567034849, Lima, Kassio Michell Gomes de
PublisherPROGRAMA DE P?S-GRADUA??O EM QU?MICA, UFRN, Brasil
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageUnknown
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFRN, instname:Universidade Federal do Rio Grande do Norte, instacron:UFRN
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.002 seconds