Global ETD Search

61	Espectroscopia de infravermelho próximo em análises de solos e plantas / Near-Infrared Spectroscopy in Analysis of soils and plants Santos, Ana Paula dos 06 June 2011 (has links) Fundação de Amparo a Pesquisa do Estado de Minas Gerais / Analyses of soils and plants, essential for crop fertilization management, are based on methodologies that are time and reagent consuming. Near infrared spectroscopy (NIR - Near-infrared) has proven as a faster and cleaner alternative for simultaneous quantification of compounds. This study evaluates the methodologies based on NIR combined with multivariate calibration methods to estimate levels of silicon (Si), organic matter (O.M.) and clay in soils, and total nitrogen (N-Total) in maize and soybean leaves. Calibration of models for soil analysis was done with 170 soil samples while that for leaf analysis used 109 (58 maize and 51 soybean), obtaining their spectra in a near infrared spectroscopy NIR model 900PLS belonging to the Laboratory Fertilizers, Federal University of Uberlandia (Lafer), Uberlândia-MG, where the models were built. The mathematical method used was the partial least squares: PLS. The model validation has been crossed and the number of latent variables ranged between 5 and 8. The reference methods for comparison were: colorimetric-extraction with calcium chloride (0,01 mol L-1) for analysis of soluble Si in the soil, Walkley-Black Colorimetric analysis of O.M. and the pipette method for clay analysis. The models for determination of N-Total were compared to the Semimicro-Kjeldahl method. After calibration and cross validation, the models were tested and the results evaluated using the correlation coefficient (r), the calibration (RMSEC) and the prediction errors (RMSEP), and relative error (ER). Also, Student s t test at 0,05 significance was used to test for equality between averages. Correlations of 0,71, 0,84 and 0,85 were obtained in the calibration of models for analysis of Si content in the soil, O.M. and clay, respectively. The prediction from these models showed low correlations (lower than 0,5) with significant t test for silicon and clay. The RMSEC obtained from Si analysis was 2,03, RMSEP of 5,74 and ER of 59,2%. To O.M. the RMSEC was 0,81, RMSEP = 1,03 and ER = 39,3%. The analysis of clay presented RMSEC = 11,2, RMSEP = 16,55 and ER = 34,7%. In the analysis of maize and soybean leaf nitrogen calibration correlations of 0,85 and 0,88 were obtained, respectively. Good correlations were obtained for prediction of maize (r = 0,80) and soybean (0,76) samples, with non significant t-test, indicating that leaf analysis for the values predicted by the models NIR/PLS did not differ from those of the reference methods. Calibration and prediction errors for N in maize and soybean were smaller than 5,0 g kg-1, and the ER for N analysis in maize (8,3%) greater than that of soybean (5,7%). The observed results demonstrate greater efficiency in the use of near infrared analysis for leaf than for soil analysis. / As análises de solos e plantas, essenciais no manejo da adubação das culturas, estão baseadas em metodologias que consomem tempo e reagentes. A espectroscopia de infravermelho próximo (NIR Near-infrared) tem se mostrado uma alternativa mais rápida e limpa para quantificação simultânea de compostos. Objetivou-se nesse trabalho avaliar as metodologias baseadas na região NIR, aliada a métodos de calibração multivariada para estimar teores de silício (Si), matéria orgânica (M.O.) e argila em solos e, nitrogênio total (N-Total) em folhas de milho e soja. Para isto, 170 amostras de solos foram utilizadas para a calibração de modelos de análises de solos e 109 amostras de folhas (58 de milho e 51 de soja), sendo seus espectros obtidos em um espectrofotômetro de infravermelho próximo modelo NIR 900PLS pertencente ao Laboratório de Fertilizantes da Universidade Federal de Uberlândia (LAFER), em Uberlândia-MG, onde os modelos foram construídos. O método matemático utilizado foi o de mínimos quadrados parciais: PLS (Parcial Least Squares). A validação dos modelos foi cruzada e o número de variáveis latentes variaram entre 5 e 8. Os métodos de referência comparados foram: colorimétrico com extração por cloreto de cálcio (0,01 mol L-1) para análise do Si solúvel no solo, Walkley-Black colorimétrico para análise de M.O. e o método da Pipeta para análise da argila. Os modelos para determinação do N-Total foram comparados ao método Semimicro-Kjeldahl. Após a calibração e validação cruzada, foi feita a previsão dos modelos onde os resultados foram avaliados através do coeficiente de correlação (r), pelos erros de calibração (RMSEC) e previsão (RMSEP), e erro relativo percentual (ER), além disso, um teste t de student a 0,05 de significância foi aplicado para testar a igualdade entre as médias. Correlações de 0,71, 0,84 e 0,85 foram obtidas na calibração de modelos para análise do teor de Si no solo, M.O. e argila, respectivamente. A previsão a partir desses modelos apresentou correlações baixas (menores que 0,5) com teste t significativo para silício e argila. O RMSEC obtido na análise de Si foi de 2,03, RMSEP de 5,74 e ER de 59,2%. Para M.O. o RMSEC foi de 0,81, RMSEP=1,03 e ER=39,3%. A análise de argila teve RMSEC=11,2, RMSEP=16,55 e ER=34,7%. Na análise do N foliar em milho e soja, foram obtidas na calibração correlações de 0,85 e 0,88, respectivamente. Na previsão de amostras foram conseguidas boas correlações para milho (r=0,80) e soja (0,76), com teste t não significativo, indicando que para análises foliares os valores previstos pelos modelos NIR-PLS não diferiram dos obtidos pelos métodos de referência. Os erros de calibração e previsão para N em milho e soja foram menores que 5,0 g kg-1, sendo o ER para análise de N em milho (8,3%) maior do que o de soja (5,7%). Os resultados observados demonstram uma maior eficiência no uso do infravermelho próximo NIR-PLS para análises foliares do que para análises de solos. / Mestre em Agronomia Calibração multivariada Near-infrared Métodos de análises Solos - Análise Análise espectral Calibração Multivariate calibration Near-infrared Methods of analysis CNPQ::CIENCIAS AGRARIAS::AGRONOMIA
62	Uso da região espectral de sobretons para determinação do teor de biodiesel e classificação de misturas diesel/biodiesel adulteradas com óleo vegetal / Using overtone regions to determine biodiesel content and classification of diesel/biodiesel blends adulterated with vegetable oils Vasconcelos, Fernanda Vera Cruz de 29 April 2011 (has links) Made available in DSpace on 2015-05-14T13:21:06Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 1844293 bytes, checksum: 0e84f52f0411baa501886d3c448e0d2f (MD5) Previous issue date: 2011-04-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work evaluates the use of overtone regions (NIR) for the classification and determination of biodiesel content in diesel/biodiesel blends adulterated with vegetable oil. For this purpose, NIR spectra were obtained using three different optical paths: 1.0 mm (9000-4000 cm-1); 10 mm (9000-6300 cm-1) e 50 mm (7500-6300 cm-1). Principal Component Analysis (PCA) and Linear Discriminant Analysis (LDA) with the Successive Projections Algorithm (SPA) were employed to build screening models to identify adulteration of diesel/biodiesel blends with vegetable oils. The multivariate calibration models (Partial Least Square - PLS, Partial Least Square with significant regression coefficients selected by Jack-Knife algorithm - PLS/JK and Multiple Regression Linear with variable selection by Successive Projections Algorithm - MLR/SPA) were developed to determine the biodiesel content. The results showed that the overtone regions with the classification strategy LDA/SPA can be used in preliminary studies to detect adulteration of diesel/biodiesel blends with vegetable oil. This strategy showed positive results for classifying, with a correct classification rate of 86% for the optical paths of 10 mm and 50 mm. In addition, the work demonstrated the potential of overtone regions with MLR/SPA regression strategy to determine biodiesel content in diesel/biodiesel blends, in the range from 0.0% to 10.0%v/v, considering the possible presence of raw oil as a contaminant. This strategy is simple, fast and uses a fewer number of spectral variables. Considering this, the overtone regions can be usefull to develop low cost instruments for the quality control of diesel/biodiesel blends, considering the lower cost of optical components for this spectral region. / Neste trabalho foi avaliado o uso da região espectral de sobretons (NIR) para classificação e determinação do teor de biodiesel em misturas diesel/biodiesel adulteradas com óleo vegetal (in natura). Para tanto, foram utilizados espectros NIR registrados em diferentes caminhos ópticos: 1,0 (9000-4000 cm-1), 10 (9000-6300 cm-1) e 50 mm (7500-6300 cm-1). A Análise de Componentes Principais (PCA) e a Análise Discriminante Linear com seleção de variáveis pelo Algoritmo das Projeções Sucessivas (LDA/SPA) foram utilizadas na identificação de adulteração de misturas diesel/biodiesel com óleo vegetal. Os modelos de calibração multivariada (Regressão por Mínimos Quadrados Parciais - PLS, Regressão por Mínimos Quadrados Parciais com coeficientes de regressão selecionados pelo algoritmo Jack-Knife - PLS/JK e Regressão Linear Múltipla com seleção de variáveis pelo Algoritmo das Projeções Sucessivas - MLR/SPA) foram desenvolvidos para determinação do teor de biodiesel. Os resultados obtidos demonstraram que a região espectral de sobretons aliada à estratégia de classificação LDA/SPA pode ser utilizada em estudos preliminares para detecção de adulteração de misturas diesel/biodiesel por óleos vegetais in natura, visto que apresentou bons resultados de classificação, com índice de acerto de 86% para os caminhos ópticos de 10 mm e 50 mm. Além disso, foi demonstrada a aplicabilidade da região de sobretons associada à estratégia de regressão MLR/SPA para determinação do teor de biodiesel em misturas diesel/biodiesel na presença de óleos vegetais in natura, na faixa de 0,0 a 10,0% v/v. Tal estratégia é simples, rápida e utiliza poucas variáveis espectrais. Neste contexto, a região espectral de sobretons pode ser útil na construção de instrumentos de baixo custo para controle de qualidade de misturas diesel/biodiesel, considerando-se o menor custo dos componentes ópticos para essa região espectral. Misturas diesel/biodiesel Espectroscopia NIR Calibração multivariada Classificação Diesel/biodiesel blends Near infrared spectrometry Multivariate calibration Classification CIENCIAS EXATAS E DA TERRA::QUIMICA
63	Determinação simultânea de Cu, Pb, Cd, Ni, Co e Zn em etanol combustível por voltametria de redissolução adsortiva e calibração multivariada. Nascimento, Danielle Silva do 06 September 2013 (has links) Made available in DSpace on 2015-05-14T13:21:22Z (GMT). No. of bitstreams: 1 ArquivoTotalDanielle.pdf: 3075160 bytes, checksum: 7e0a0035250fe5165be8f049a27cdce6 (MD5) Previous issue date: 2013-09-06 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This study seeks to discuss the use of multivariate calibration techniques in the development of a methodology for simultaneous determination of Cu, Pb, Cd, Ni, Co and Zn at trace level using differential pulse adsorptive stripping voltammetry (DPAdSV). A hanging drop mercury electrode (HDME) was employed as working electrode. The calibration set was assembled by using a Brereton s design, performing 25 replicate mixtures. The different linear ranges were selected from univariate models, and verified using tests of lack of fit and significance by the ANOVA (Analysis of Variance) study. The studied ranges were Cu (0,30 3μg L-1), Pb (1 - 10μg L-1), Cd (0,5 - 5μg L-1), Ni (0,3 - 3μg L-1), Co (0,09 0,5μg L-1) e Zn (0,6 - 6μg L-1). The voltammograms were preprocessed with the algorithms AsLS (asymmetric least squares) and icoshift (interval-correlation-shifting) in order to perform baseline correction and peak alignment, respectively. The following multivariate calibration algorithms were evaluated: partial least-squares regression (PLS) and multiple linear regression with prior variable selection by successive projections algorithm (SPA-MLR). For the validation of the calibration models 10 mixtures with random concentration of each analyte were used, resulting in RMSEV between 0,03 and 0,86 g L-1. As an application of the developed method in the analysis of real samples, hydrated ethyl alcohol fuel (HEAF) was chosen as target matrix. The determination of inorganic contaminants in ethanol fuel samples is important to ensure product quality and pollution control due to release of toxic metals by burning the fuel. The validated models were satisfactorily tested in commercial samples of HEAF from different gas stations of João Pessoa, Brazil. / Resumo: Este trabalho visa avaliar o uso de técnicas de calibração multivariada no desenvolvimento de uma metodologia de determinação simultânea dos metais Cu, Pb, Cd, Ni, Co e Zn em nível-traço utilizando voltametria de pulso diferencial com redissolução adsortiva (DPAdSV). Foi empregado como eletrodo de trabalho um eletrodo de gota pendente de mercúrio (HDME). Para construção do conjunto de calibração aplicou-se um planejamento de calibração de Brereton, analisando-se 25 misturas em replicata. As faixas lineares de concentração foram obtidas dos modelos univariados e avaliados pelos testes de falta de ajuste e significância de regressão por meio da análise de variância (ANOVA). As seguintes faixas lineares de concentração foram utilizadas, Cu (0,30 3μg L-1), Pb (1 - 10μg L-1), Cd (0,5 - 5μg L-1), Ni (0,3 - 3μg L-1), Co (0,09 0,5μg L-1) e Zn (0,6 - 6μg L-1). O pré-processamento dos voltamogramas consistiu em uma correção da linha de base mediante o algoritmo AsLS (mínimos quadrados assimétricos). Posteriormente, os picos de redissolução de cada analito foram alinhados usando-se o algoritmo icoshift (otimização da correlação mediante deslocamento por intervalos). Foram empregados os seguintes algoritmos de calibração: regressão por mínimos quadrados parciais (PLS) e regressão linear múltipla com seleção prévia de variáveis pelo algoritmo das projeções sucessivas (SPA-MLR). Para a validação dos modelos de calibração foram empregadas 10 misturas com concentração aleatória de cada analito, obtendo-se RMSEV entre 0,03 e 0,86 μg L-1. Como aplicação do método desenvolvido na análise de amostras reais, foi escolhida a matriz álcool etílico hidratado combustível (AEHC). Os modelos validados foram testados satisfatoriamente em amostras comerciais de AEHC de diferentes postos de gasolina de João Pessoa- PB, Brasil. Química Voltametria Determinação simultânea Calibração multivariada Seleção de variáveis Etanol Voltammetry Simultaneous determination Multivariate calibration Variable selection Ethanol fuel CIENCIAS EXATAS E DA TERRA::QUIMICA
64	Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas Soares, Sófacles Figueiredo Carreiro 22 September 2010 (has links) Made available in DSpace on 2015-05-14T13:21:51Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 2432134 bytes, checksum: aeda44e0d999a92b980354a5ea66ce01 (MD5) Previous issue date: 2010-09-22 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This study proposes a modification in the Successive Projections Algorithm (SPA), that makes models of Multiple Linear Regression (MLR) more robust in terms of interference. In SPA, subsets of variables are compared based on their root mean square errors for the validation set. By taking into account the statistical prediction error obtained for the calibration set, and dividing by the statistical prediction error obtained for the prediction set, SPA can be improved. Also taken into account is the leverage associated with each sample. Three case studies involving; simulated analytic determinations, food colorants (UV-VIS spectrometry), and ethanol in gasoline (NIR spectrometry) are discussed. The results were evaluated using the root mean square error for an independent prediction set (Root Mean Square Error of Prediction - RMSEP), graphs of the variables, and the statistical tests t and F. The MLR models obtained by the selection using the new function were called SPE-SPA-MLR. When an interferent was present in the prediction spectra, almost all of the models performed better than both SPA-MLR and PLS. The models when compared to SPA-MLR showed that the change promoted better models in all cases giving smaller RMSEPs and variable numbers. The SPE-SPA-MLR was not better in some cases, than PLS models. The variables selected by SPA-SPE-MLR when observed in the spectra were detected in regions where interference was the at its smallest, revealing great potential. The modifications presented here make a useful tool for the basic formulation of the SPA. / Este trabalho propõe uma modificação no Algoritmo das Projeções Sucessivas (Sucessive Projection Algorithm - SPA), com objetivo de aumentar a robustez a interferentes nos modelos de Regressão Linear Múltipla (Multiple Linear Regression - MLR) construídos. Na formulação original do SPA, subconjuntos de variáveis são comparados entre si com base na raiz do erro quadrático médio obtido em um conjunto de validação. De acordo com o critério aqui proposto, a comparação é feita também levando em conta o erro estatístico de previsão (Statistical Prediction Error SPE) obtido para o conjunto de calibração dividido pelo erro estatístico de previsão obtido para o conjunto de previsão. Tal métrica leva em conta a leverage associada a cada amostra. Três estudos de caso envolvendo a determinação de analitos simulados, corantes alimentícios por espectrometria UV-VIS e álcool em gasolinas por espectrometria NIR são discutidos. Os resultados são avaliados em termos da raiz do erro quadrático médio em um conjunto de previsão independente (Root Mean Square Error of Prediction - RMSEP), dos gráficos das variáveis selecionadas e através do testes estatísticos t e F. Os modelos MLR obtidos a partir da seleção usando a nova função custo foram chamados aqui de SPA-SPE-MLR. Estes modelos foram comparados com o SPA-MLR e PLS. Os desempenhos de previsão do SPA-SPEMLR apresentados foram melhores em quase todos os modelos construídos quando algum interferente estava presente nos espectros de previsão. Estes modelos quando comparados ao SPA-MLR, revelou que a mudança promoveu melhorias em todos os casos fornecendo RMSEPs e números de variáveis menores. O SPA-SPE-MLR só não foi melhor que alguns modelos PLS. As variáveis selecionadas pelo SPA-SPE-MLR quando observadas nos espectros se mostraram em regiões onde a ação do interferente foi à menor possível revelando o grande potencial que tal mudança provocou. Desta forma a modificação aqui apresentada pode ser considerada como uma ferramenta útil para a formulação básica do SPA. Regressão linear múltipla Seleção de variáveis Multiple linear regression Variable selection CIENCIAS EXATAS E DA TERRA::QUIMICA
65	Variable selection in multivariate calibration considering non-decomposability assumption and building blocks hypothesis / Seleção de variáveis em calibração multivariada considerando a presunção de não-decomponibilidade e a hipótese de blocos construtores Paula, Lauro Cássio Martins de 06 December 2018 (has links) Submitted by Liliane Ferreira (ljuvencia30@gmail.com) on 2018-12-12T10:14:40Z No. of bitstreams: 2 Tese - Lauro Cássio Martins de Paula - 2018.pdf: 7484273 bytes, checksum: a3c47ef9c05d03a8dce4dce89a2df34b (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-12-12T10:36:08Z (GMT) No. of bitstreams: 2 Tese - Lauro Cássio Martins de Paula - 2018.pdf: 7484273 bytes, checksum: a3c47ef9c05d03a8dce4dce89a2df34b (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-12-12T10:36:08Z (GMT). No. of bitstreams: 2 Tese - Lauro Cássio Martins de Paula - 2018.pdf: 7484273 bytes, checksum: a3c47ef9c05d03a8dce4dce89a2df34b (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2018-12-06 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The procedure used to select a subset of suitable features in a given data set consists in variable selection, which is important when the dataset contains large number of variables and many of them are redundant. Multivariate calibration combines variable selection with statistical techniques to build mathematical models which relate the data to a given property of interest in order to predict this property by selecting informative variables. In this context, variable selection techniques have been widely applied to the solution of several optimization problems. For instance, Genetic Algorithms (GAs) are easy to implement and consist in a population-based model that uses selection and recombination operators to generate new solutions. However, usually in multivariate calibration the dataset present a considerable correlation degree among variables and this provides an evidence about the problem not being properly decomposed. Moreover, some studies in literature have claimed genetic operators used by GAs can cause the building blocks (BBs) disruption of viable solutions. Therefore, this work aims to claim that selecting variables in multivariate calibration is a non-completely decomposable problem (hypothesis 1) as well as that recombination operators affects the non-decomposability assumption (hypothesis 2). Additionally, we are proposing two heuristics, one local search-based operator and two versions of an Epistasis-based Feature Selection Algorithm (EbFSA) to improve model prediction performance and avoid BBs disruption. Based on the performed inquiry and experimental results, we are able to endorse the viability of our hypotheses and demonstrate EbFSA can overcome some traditional algorithms. / Seleção de variáveis é um procedimento para selecionar um subconjunto de características viáveis em um conjunto de dados, o qual se torna importante quando esse conjunto contém muitas variáveis redundantes. A calibração multivariada combina seleção de variáveis com técnicas estatísticas para construir modelos matemáticos com o intuito de predizer uma propriedade de interesse. Nesse contexto, técnicas de seleção têm sido aplicadas na solução de diversos problemas. Por exemplo, Algoritmos Genéticos (AGs) são fáceis de implementar e consistem em um modelo baseado em população, o qual utiliza operadores de seleção e recombinação para gerar novos indivíduos. No entanto, geralmente em calibração multivariada, o conjunto de dados apresenta um grau de correlação considerável entre as variáveis e isso nos fornece uma evidência de que tal problema não pode ser decomposto adequadamente. Além disso, alguns estudos da literatura têm afirmado que os operadores genéticos utilizados pelos AGs podem causar o rompimento dos Blocos Construtores (Building Blocks - BBs) das soluções viáveis. Portanto, este trabalho objetiva demonstrar que a seleção de variáveis em calibração multivariada é um problema não-completamente decomponível (hipótese 1), assim como que operadores de recombinação afetam a presunção de não-decomponibilidade (hipótese 2). Adicionalmente, este trabalho propõe duas heurísticas, um operador de busca local e duas versões de um Algoritmo para Seleção de Variáveis baseado em Epistasia (EbFSA) para aprimorar a capacidade de predição do modelo e evitar o rompimento de BBs. Baseando-se na pesquisa realizada e nos resultados obtidos, torna-se possível confirmar a viabilidade de nossas hipóteses e demonstrar que o EbFSA consegue superar alguns algoritmos tradicionais. Multivariate calibration Variable selection Genetic algorithm Building blocks Calibração multivariada Seleção de variáveis Algoritmo genético Blocos construtores
66	Aplicação da espectroscopia de infravermelho próximo para a determinação do caseinomacropeptídeo em leite UAT / Application of near infrared spectroscopy for caseinomacropeptídeo determination in UHT milk OLIVEIRA, Raphael Rocha de 26 February 2010 (has links) Made available in DSpace on 2014-07-29T15:07:53Z (GMT). No. of bitstreams: 1 Dissertacao-Raphael Rocha de Oliveira.pdf: 769424 bytes, checksum: 06c1655cb89d85d3f14e0f0ed376e67e (MD5) Previous issue date: 2010-02-26 / This work was carried out to develop a method for the determination of CMP in UHT milk using near-infrared spectroscopy. UHT milk from eight different brands were used for the construction of calibration models. In each of these brands were obtained eight treatments based on the addition of reconstituted whey powder to milk, to 0 (sample with no added whey), 1%, 2%, 3%, 4%, 6% 8% and 10%, giving a total of 64 treatments. The spectra were obtained by NIRS in three replicates, giving a total of 192 spectra. The HPLC results showed a rate of CMP in the samples obtained in the market, ranging between 33.64 and 398.78 mg/L. These results indicate fraud by the addition of whey or low quality of raw milk used. Altogether, 48 models were obtained, showing that the development of a calibration model suitable for the detection of CMP in UHT milk should be used with the PLS method, the method of selecting maximum distance and the pretreatment 2nd derivative and standard normal variate. The near-infrared regions most closely correlated with the vibrational motion of the amino acids present in the CMP were: 1100-1310, 1400-1430, 1490-1550, 1640-1680, 1780-1970, 2020- 2100 and 2310-2350 nm. When these regions were grouped with the selected chemometric tools, have been found the best results from R2 (0,8946) and PRESS (1323569,25), using 6 factors, and eliminating only 1.56% of the spectra (outliers). The results of the samples used for validation, indicates that the addition of whey, or the use of materials of poor quality for the production of UHT milk can be a routine. The results also showed that the calibration model was fine adjusted, as the ratio SEC/SEV was within the range of similarity (0.74). Moreover, the calibration model showed the ability to distinguish, because it recognized the 48 spectra of validation, but did not recognized spectra of four brands of skim milk UHT. However, there is a need for a calibration set wider so that be representative of the entire population / O presente trabalho foi realizado com o objetivo de desenvolver um método para a determinação de CMP em leite UAT através da aplicação da espectroscopia de infravermelho próximo. Leites UAT de oito marcas diferentes foram utilizados para a construção dos modelos de calibração. Em cada uma dessas marcas foram obtidos oito tratamentos, com base na adição de soro em pó reconstituído ao leite, em 0 (amostra sem adição de soro), 1%, 2%, 3%, 4%, 6%, 8% e 10%, formando um total de 64 tratamentos. Os espectros foram obtidos por NIRS em três replicatas, formando um total de 192 espectros. Os resultados da CLAE mostraram um índice de CMP nas amostras obtidas no mercado, variando entre 33,64 e 398,78 mg/L. Esses resultados indicam fraude por adição de soro de queijo ou baixa qualidade do leite cru utilizado como matéria-prima. Ao todo, 48 modelos foram obtidos, mostrando que para o desenvolvimento de um modelo de calibração adequado para a determinação de CMP em leite UAT deve-se utilizar juntamente com o método de regressão PLS, o método de seleção de espectros máxima distância e os pré-tratamentos 2ª derivada e variável normal padronizada. As regiões do infravermelho próximo mais correlacionadas com os movimentos vibracionais dos aminoácidos presentes no CMP foram: 1100-1310; 1400-1430; 1490-1550; 1640-1680; 1780-1970; 2020-2100 e 2310-2350 nm. Quando foram agrupadas essas regiões, utilizando as ferramentas quimiométricas selecionadas, foram encontrados os melhores resultados de R2 (0,8946) e de PRESS (1323569,25), utilizando seis fatores e eliminando apenas 1,56% dos espectros (outliers). Os resultados das amostras utilizadas na etapa de validação, indicam que a adição de soro de queijo, ou a utilização de matérias-primas de baixa qualidade inicial para a fabricação de leite UAT, pode ser rotineira. Os resultados também mostraram que o modelo de calibração foi bem ajustado, já que a razão SEC/SEV apresentou-se dentro do intervalo de similaridade (0,74). Além disso, o modelo de calibração apresentou capacidade de distinção, pois reconheceu os 48 espectros da validação, mas não reconheceu espectros de quatro marcas de leite UAT desnatado. A espectroscopia de infravermelho próximo pode ser uma alternativa para a determinação de CMP em leite UAT, desde que haja um conjunto de calibração com amostras representativas da população a ser predita no futuro
67	Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada / Multiobjective optimization for feature and samples selection in double chromosome of integer representation and variable size for multivariate calibration Bastos, Hélios Kárum de Oliveira 24 August 2017 (has links) Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2018-01-10T09:42:22Z No. of bitstreams: 2 Dissertação - Hélios Kárum de Oliveira Bastos - 2017.pdf: 2219804 bytes, checksum: ba853c18f7e7e2c65eb0a342d4a34640 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-01-10T09:42:46Z (GMT) No. of bitstreams: 2 Dissertação - Hélios Kárum de Oliveira Bastos - 2017.pdf: 2219804 bytes, checksum: ba853c18f7e7e2c65eb0a342d4a34640 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-01-10T09:42:46Z (GMT). No. of bitstreams: 2 Dissertação - Hélios Kárum de Oliveira Bastos - 2017.pdf: 2219804 bytes, checksum: ba853c18f7e7e2c65eb0a342d4a34640 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017-08-24 / Multiobjective Optimization for feature and samples selection in double chromosome of integer representation and variable size for multivariate calibration} In several problems of regression, classification, prediction, approximation Optimization, the original data contain a large number of variables to obtain a better representation of the problem under consideration. However, a significant part of the variables may be irrelevant and redundant from the point of view of machine learning. Indeed, one of the challenges to be overcome is a selection of a subset of variables that has the best perform. One of the breakthroughs in this type of problem is the use of a multiobjective formulation that avoids the overlap of the model to the training data set. Another important point is the process of choosing the objects to be used in the learning stage. Generally, a selection of variables and treatment objects are treated separately and without dependence. This project proposes a multiobjective modeling to select variables and objects simultaneously using a genetic integer representation algorithm with variable size chromosomes. It is expected that a simultaneous selection of objects and variables on a multiobjective context produce better results in a traditional approach. As a case study this work utilized an analysis of near infrared (NIR) material on oil samples for the purpose of estimating the concentration of an interest properties such set was used in the competition conducted at the International Diffuse Reflectance Conference (IDRC) in the year 2014. / Em diversos problemas de regressão, classificação, previsão, aproximação e otimização, os dados originais contêm um grande número de variáveis introduzidas para se obter uma melhor representação do problema considerado. Entretanto, uma parte significativa destas variáveis podem ser irrelevantes e/ou redundantes do ponto de vista do aprendizado de máquina acerca do problema. Com efeito, um dos desafios a ser superados é a seleção de um subconjunto de variáveis que apresentem um melhor desempenho. Um dos avanços recentes neste tipo de problema está no uso de uma formulação multiobjetivo que evita o superajuste do modelo ao conjunto de dados de treinamento. Outro ponto importante refere-se ao processo de escolha adequada dos objetos a serem utilizados na etapa de aprendizado. Geralmente, a seleção de variáveis e de objetos de treinamento são tratados de forma separada e sem dependência. Este projeto propõe uma modelagem multiobjetivo para seleção de variáveis e objetos de forma simultânea utilizando-se de algoritmo genético de representação inteira com cromossomos de tamanho variáveis. Espera-se que a seleção simultânea de objetos e variáveis no contexto multiobjetivo produza melhores resultados em relação a abordagem tradicional. Como estudo de caso este trabalho utiliza dados obtidos por uma análise de material com ondas de infravermelho próximo (NIR) sobre amostras de petróleo com o propósito de estimar a concentração de uma propriedade de interesse, tal conjunto foi utilizado na competição realizada no International Diffuse Reflectance Conference (IDRC) (\url{http://cnirs.clubexpress.com/content.aspx?page_id=22&club_id=409746&module_id=19 0211}), no ano de 2015. Calibração multivariada Algoritmo genético Otimização multiobjetivo NSGA-II Representação inteira Multivariate calibration Genetic algorithm Multiobjective optimization NSGA-II Integer representation
68	Algoritmo evolutivo com representação inteira para seleção de características / Evolutionary algorithm using integer representation for feature selection Sousa, Rhelcris Salvino de 20 April 2017 (has links) Submitted by JÚLIO HEBER SILVA (julioheber@yahoo.com.br) on 2017-05-31T17:56:45Z No. of bitstreams: 2 Dissertação - Rhelcris Salvino de Sousa -2017.pdf: 12280322 bytes, checksum: 2985f69ec9d4b79ed4266baba761bd15 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-06-01T11:00:44Z (GMT) No. of bitstreams: 2 Dissertação - Rhelcris Salvino de Sousa -2017.pdf: 12280322 bytes, checksum: 2985f69ec9d4b79ed4266baba761bd15 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-06-01T11:00:44Z (GMT). No. of bitstreams: 2 Dissertação - Rhelcris Salvino de Sousa -2017.pdf: 12280322 bytes, checksum: 2985f69ec9d4b79ed4266baba761bd15 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017-04-20 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Machine learning problems usually involve a large number of features or variables. In this context, feature selection algorithms have the challenge of determining a reduced subset from the original set. The main difficulty in this task is the high number of solutions available in the search space. In this context, genetic algorithm is one of the most used techniques in this type of problem due to its implicit parallelism in the exploration of the search space of the problem considered. However, a binary type representation is usually used to encode the solutions. This work proposes an implementation solution that makes use of integer representation called intEA-MLR instead of binary. The integer representation optimizes the understanding of the data, as the features to be selected are represented by integer values, reducing the size of the chromosome used in the search process. The intEA-MLR in this context is presented as an alternative way of solving high dimensional problems in regression problems. As a case study, three different sets of data are used concerning problems involving determination of properties of interest in samples of 1) Grain Wheat, 2) Medicine tablets and 3) petroleum. Such sets were used in competitions held at the International Diffuse Reflectance Conference (IDRC) (http://cnirs.clubexpress.com/content.aspx?page_id=22&club_ id=409746&module_id=190211), in the years 2008, 2012 and 2014, respectively. The results showed that the proposed solution was able to improve the obtained solutions when compared to the classical implementation that makes use of binary coding, with both more accurate prediction models and with reduced number of features. IntEA-MLR also outperformed the competition winners, reaching 91.17% better than the competition winner for the petroleum data set. In addition, the results also indicated that the computation time required by the intEA-MLR is relatively smaller as more features are available. / Problemas de aprendizado de máquina geralmente envolvem um grande número de características ou variáveis. Nesse contexto, algoritmos de seleção de características tem como desafio determinar um subconjunto reduzido a partir do conjunto original. A principal dificuldade nesta tarefa é o elevado número de soluções disponíveis no espaço de busca. Nesse contexto, algoritmo genético é uma das técnicas mais utilizadas nesse tipo de problema em razão de seu paralelismo implícito na exploração do espaço de busca do problema considerado. Entretanto, geralmente utiliza-se uma representação do tipo biná- ria para codificar as soluções. Neste trabalho é proposto uma solução de implementação que faz uso de representação inteira denominada intEA-MLR em detrimento da binária. A representação inteira otimiza o entendimento dos dados, na medida em que as características a serem selecionadas são determinadas por valores inteiros reduzindo o tamanho do cromossomo utilizado no processo de busca. O intEA-MLR nesse contexto, se apresenta como uma forma alternativa de resolução de problemas de alta dimensionalidade em problemas de regressão. Como estudo de caso, utiliza-se três diferentes conjuntos de dados referente a problemas envolvendo determinação de propriedades de interesse em amostra de 1) Grãos de Trigo, 2) Comprimidos de remédio e 3) Petróleo. Tais conjuntos foram utilizados nas competições realizadas no International Diffuse Reflectance Conference (IDRC) (http://cnirs.clubexpress.com/content.aspx?page_id=22&club_ id=409746&module_id=190211), nos anos de 2008, 2012 e 2014, respectivamente. Os resultados mostraram que a solução proposta foi capaz de aprimorar as soluções obtidas quando comparadas com a implementação clássica que faz uso da codificação binária, tanto com modelos de predição mais acurados quanto com número reduzido de características. intEA-MLR também obteve resultados superiores aos dos vencedores das competições, chegando a obter soluções 91,17% melhores do que o vencedor da competição para o conjunto de dados de petróleo. Adicionalmente, os resultados também indicaram que o tempo de computação requerido pelo intEA-MLR é relativamente menor a medida em que um número maior de características estão disponíveis. Seleção de características Computação evolutiva Calibração multivariada Regressão linear múltipla Features selection Evolutionary computation Multivariate calibration Multiple linear regression
69	Avaliação do potencial da espectroscopia no infravermelho próximo como método de rotina para a determinação de carbono orgânico do solo / Evaluation of the potential of near infrared spectroscopy as routine method for soil organic carbon analysis Souza, André Marcelo de, 1977- 26 August 2018 (has links) Orientador: Ronei Jesus Poppi / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Química / Made available in DSpace on 2018-08-26T13:27:08Z (GMT). No. of bitstreams: 1 Souza_AndreMarcelode_D.pdf: 34076641 bytes, checksum: 9b864adff6bf9857ffe47d6b6afee68a (MD5) Previous issue date: 2015 / Resumo: As pesquisas atuais apontam que a espectroscopia no infravermelho próximo (NIR) é a técnica alternativa mais promissora para a determinação de carbono orgânico do solo (SOC) nos laboratórios de todo o mundo em substituição total ou parcial aos métodos tradicionais de via úmida. Considerado este fato, foi desenvolvido e validado um método para a determinação de SOC por espectroscopia NIR, visando seu empregado como método de rotina em laboratórios de análise de solos do Brasil. Para este fim, foram construídos modelos de calibração multivariada a partir de um número expressivo de amostras de solos (1490 amostras, 2.980 espectros) que englobam a variabilidade de solos brasileiros. Estes modelos foram validados através da submissão dos valores previstos das concentrações de matéria orgânica do solo (SOM) ao Programa de Análise de Qualidade de Laboratórios de Fertilidade (PAQLF). As questões envolvendo a transferência de calibração entre múltiplos instrumentos também foram abordadas e a regressão por vetores de suporte (SVR) foi avaliada como alternativa à regressão em mínimos quadrados parciais (PLS). Os resultados alcançados comprovaram de maneira contundente a robustez do método proposto e indicaram que o mesmo pode substitui o método de via úmida, superando seu desempenho em alguns casos. No estudo de transferência de calibração, foi demonstrado que quando dois ou mais espectrofotômetros NIR são empregados na aquisição dos dados, recomenda-se que ambos sejam de mesma configuração. Porém, quando instrumentos diferentes foram envolvidos, o método de atualização do modelo através da matriz aumentada apresentou resultados satisfatórios em relação aos demais métodos avaliados. Existem, no entanto, pelo menos dois gargalos da implementação da espectroscopia NIR em análises de rotina: (1) o elevado custo dos instrumentos em relação ao orçamento dos laboratórios de análise de solos no Brasil; e (2) a necessidade do emprego da quimiometria na etapa de modelagem dos dados. Ambas as questões podem ser solucionadas com políticas de subsídios para compra de instrumentos e intensivos treinamentos em quimiometria e espectroscopia NIR, que podem ser oferecidos pela Empresa Brasileira de Pesquisa Agropecuária e por instituições de ensino superior do Brasil / Abstract: Current research indicates that near infrared spectroscopy (NIR) is the most promising alternative technique for the determination of soil organic carbon (SOC) in laboratories around the world in total or partial replacement traditional wet chemistry methods. Considering this fact, in this research it was developed and validated a method for determination of SOC by NIR spectroscopy, aiming its use in soils laboratories in Brazil as a routine analysis method. To this end, multivariate calibration models were constructed from a large number of soil samples (samples 1490, 2980 spectra) covering the variability of brazilian soils. These models were validated by the submission of the predicted concentrations of soil organic matter (SOM) in the Quality Program of Analysis of Fertility Laboratories (PAQLF). Issues involving the calibration transfer among several instruments were discussed and the support vector regression (SVR) was evaluated as an alternative to PLS. The results proved in a conclusive way the robustness of the proposed method and indicated that it can replace the wet chemistry method, outperforming it in some cases. Some general recommendations that can be drawn from this work are: when two or more NIR spectrophotometers are involved, it is recommended purchase or apply those of same configuration because the transfer methods evaluated generate better models when compared to those of different configuration. However, when different instruments are involved, the method of model updating through the augmented matrix showed satisfactory results when compared to other methods evaluated. There are at least two bottlenecks of the implementation of the NIR spectroscopy method in routine analysis of soil laboratories: (1) the cost of NIR spectroscopy instruments and their maintenance are considered high in relation to the budget of the laboratories of soil analysis in Brazil and (2) the spectral data treatment, which requires the use of chemometrics. Both aspects that hinder the implantation of NIR spectroscopy as a routine method can be solved, with a policy of subsidies to purchase equipment and intensive training in chemometrics that can be offered by Brazilian Corporation of Agricultural Research (Embrapa) and also by brazilian teaching institutions / Doutorado / Quimica Analitica / Doutor em Ciências Calibração multivariada Figuras de mérito Ensaio interlaboratorial Matéria orgânica do solo Transferência de calibração Multivariate calibration Figure of merit Interlaboratorial comparison Soil organic matter Calibration transfer
70	Caracterização de amêndoas de cacau produzidas em diferentes estados brasileiros e aplicação de espectroscopia no infravermelho próximo e quimiometria como alternativa para o controle de qualidade / Characterization of cocoa beans from different Brazilian states and application of Near-Infrared Spectroscopy and chemometrics as an alternative for the quality control Hashimoto, Juliana Campos, 1986- 26 August 2018 (has links) Orientadores: Juliana Azevedo Lima Pallone, Priscilla Efraim / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia de Alimentos / Made available in DSpace on 2018-08-26T22:17:20Z (GMT). No. of bitstreams: 1 Hashimoto_JulianaCampos_D.pdf: 1464157 bytes, checksum: dc1a53f725dfb7e2dbc0a615838c0c73 (MD5) Previous issue date: 2015 / Resumo: O desenvolvimento da cacauicultura no Brasil apresenta vários desafios no que se refere ao reconhecimento da qualidade e padronização da produção. Dois aspectos relevantes relacionados a essas dificuldades foram abordados nesta pesquisa. O primeiro aspecto trata da falta de informação referente à composição química das amêndoas de cacau produzidas em diferentes estados brasileiros e às características sensoriais dos produtos derivados. A este respeito, amostras de diferentes regiões produtoras (Bahia-BA, Pará-PA, Rondônia-RO e Costa do Marfim-CM) foram analisadas quanto a parâmetros físicos e químicos relevantes para a qualidade desta matéria prima, incluindo-se: número de amêndoas em 100 g, prova de corte, porcentagem de casca, pH, acidez, teores de umidade, lipídios, proteína, compostos fenólicos totais, teobromina e cafeína. A avaliação física das amêndoas de cacau por meio da prova de corte permitiu concluir que todas as amostras apresentaram padrão comercial satisfatório, porém, evidenciou-se a falta de padronização na etapa de pré-processamento. Diferenças significativas em relação à umidade, acidez, compostos fenólicos totais, teobromina e cafeína foram verificadas, as quais podem afetar diretamente a qualidade dos produtos derivados. A avaliação sensorial de chocolates elaborados a partir das amêndoas de origens distintas (BA, PA, RO, CM e Espírito Santo-ES) mostrou diferenças significativas entre as amostras, as quais foram percebidas tanto pelo painel sensorial treinado quanto pelo grupo de consumidores. As amostras de chocolates BA e CM mostraram diferenças importantes no perfil sensorial, enquanto as amostras RO e PA apresentaram similaridades e características intermediárias em relação às demais. Quanto à aceitação global, pequenas diferenças foram observadas, sendo que a amostra PA apresentou valor médio superior ao do chocolate BA, provavelmente devido à maior intensidade dos gostos ácido e amargo na amostra BA. O segundo aspecto abordado neste estudo trata da falta de métodos analíticos rápidos e objetivos para a avaliação da qualidade de amêndoas de cacau. Portanto, os dados das análises físico-químicas das 81 amostras de amêndoas de cacau obtidos na primeira etapa da pesquisa foram utilizados para a construção de modelos de calibração multivariada por meio da correlação com os espectros de reflectância difusa medidos na região do infravermelho próximo (10000-4000 cm-1). Nove modelos de regressão por Quadrados Mínimos Parciais foram desenvolvidos para a previsão de diversos parâmetros de composição química (umidade, porcentagem de casca, pH, acidez, lipídios, proteínas, compostos fenólicos totais, concentração de teobromina e cafeína) pela análise direta das amostras moídas e peneiradas, sem preparo adicional e geração de resíduos. Com exceção da concentração de cafeína, todos os parâmetros foram previstos com erros relativos médios menores que 10,2%, os quais são aceitáveis quando comparados aos coeficientes de variação dos métodos de referência usualmente utilizados. Dessa forma, os resultados obtidos demonstraram que o emprego da Espectroscopia no Infravermelho Próximo, aliada a quimiometria, é viável e indicado para o controle de qualidade de amêndoas de cacau em diversas etapas da cadeia produtiva / Abstract: The development of cocoa culture in Brazil presents several challenges with respect to recognition of the quality and production standardization. Two important aspects related to these difficulties were addressed in this study. The first aspect is the lack of information on the chemical composition of cocoa beans produced in different Brazilian states and sensory characteristics of derivatives. In this regard, samples from different producing regions (Bahia-BA, Pará-PA, Rondônia-RO and the Ivory Coast-CM) were analyzed for physical and chemical parameters relevant to the overall quality of this raw material, which included: bean count, cut test, pH, acidity and shell, moisture, total lipid, protein, phenolic compounds, theobromine and caffeine contents. Physical evaluation of cocoa beans by means of the cut test showed that all samples presented satisfactory commercial standard, however, revealed a lack of standardization in the post-harvesting practices. Significant differences in moisture, acidity, total phenolic compounds, theobromine and caffeine were found, which can directly affect the quality of derivatives. The sensory evaluation of chocolates manufactured with cocoa beans from different origins (BA, PA, RO, CM and Espírito Santo-ES) showed significant differences between the samples, which were identified by both the trained sensory panel as the consumers. BA and CM chocolate samples showed important differences in the sensory profile, while the RO and PA samples presented similarities and intermediate characteristics in relation to the others. The overall acceptance presented little differences with the PA chocolate scored higher than the BA chocolate, probably due to the more intense acidic and bitter tastes in the BA sample. The second subject discussed in this study is the unavailability of rapid and objective analytical methods for assessing the quality of cocoa beans. For this, the physicochemical data of 81 cocoa bean samples acquired in the first stage of this research, were used for the construction of multivariate calibration models by correlation with diffuse reflectance spectra measured in the near infrared region (10000-4000 cm-1). Nine Partial Least Squares regression models were developed allowing the prediction of various chemical parameters (moisture, pH, acidity, total lipids, protein, shell content, total phenolic compounds, concentration of theobromine and caffeine) through direct analysis of samples milled and sieved without any additional preparation. With the exception of caffeine concentration, all of the parameters were predicted with relative errors smaller than an average of 10.2%, which is acceptable when compared to the coefficients of variation of the reference methods usually used. Thus, the results obtained demonstrate that the use of NIR in conjunction with chemometrics is feasible and recommended for the quality control of cocoa beans in various stages of the production chain / Doutorado / Ciência de Alimentos / Doutora em Ciência de Alimentos Amêndoas de cacau Espectroscopia no infravermelho próximo Quimiometria Calibração multivariada Analise sensorial Cocoa beans Near-infrared spectroscopy Chemometrics Multivariate calibration Sensory analysis

Search results