Global ETD Search

1	Detecção e diagnóstico de falhas empregando técnicas de classificação de padrões com seleção de atributos. Anderson da Silva Soares 15 December 2010 (has links) Neste trabalho é proposta uma abordagem para detecção e diagnóstico de falhas empregando técnicas de seleção de atributos e classificação de padrões. Tal abordagem faz uso do Algoritmo das Projeções Sucessivas (APS) para seleção de atributos a serem usados em um classificador de Análise Discriminante Linear (ADL). A aplicação do APS-ADL é proposta em duas etapas: pré-seleção de sensores e seleção de atributos com atrasos de tempo. São elaboradas ainda duas modificações na formulação original do algoritmo. A primeira faz uso da informação discriminatória univariada para evitar que atributos com alto poder de discriminação sejam descartados e a segunda propõe o uso de um teste de hipótese para simplificação do classificador através da eliminação de atributos. Adicionalmente, propõe-se um aprimoramento computacional para redução da complexidade do APS-ADL. Para o problema de detecção é proposto o uso de uma etapa prévia de agrupamento de padrões para identificar tipos de falhas similares de modo a reduzir o número de classificadores a serem empregados. O estudo de caso envolve o uso do modelo Tennessee Eastman Process, que é amplamente usado como benchmark na área de detecção e diagnóstico de falhas. Para fins de comparação, é empregado um algoritmo genético (AG) para seleção de atributos, bem como duas técnicas de classificação que fazem uso de todos os atributos disponíveis, a saber os métodos de K-vizinhos mais próximos (K-Nearest Neighbors, KNN) e mínimos-quadrados parciais (Partial Least Squares, PLS). Adicionalmente, investiga-se o uso dos atributos selecionados pelo APS-ADL para fins de classificação por Análise Discriminante Quadrática (ADQ). Os resultados mostram que (i) o uso de atrasos de tempo permite uma melhor discriminação entre as classes consideradas, (ii) a etapa preliminar de agrupamento de falhas simplifica o problema de detecção, (iii) a proposta de uso de informação univariada no APS-ADL melhora a taxa de acerto resultante, (iv) a pré-seleção de sensores facilita a seleção de atributos sem comprometer os resultados, (v) a proposta de eliminação de atributos no APS-ADL melhora a parcimônia dos classificadores sem alteração significativa de desempenho e (vi) dentre as técnicas consideradas, o APS-ADL e o APS-ADQ apresentam melhor acurácia tanto na detecção quanto no diagnóstico de falhas. Detecção de falhas Análise de falhas Classificação de padrões Algoritmo das projeções sucessivas Análise discriminante (Estatística) Controle
2	Transferência de calibração de instrumentos para análise espectrométrica empregando seleção de variáveis, reamostragem e combinação de modelos. Marcelo do Nascimento Martins 02 June 2006 (has links) A espectroscopia no infravermelho tem se mostrado uma ferramenta de valia para o monitoramento da qualidade de combustíveis. Contudo, tal técnica requer a calibração de modelos empíricos para relacionar medidas espectrais com parâmetros físico-químicos de interesse. Neste trabalho propõe-se um método que permite explorar um conjunto de dados já adquirido por um espectrômetro (instrumento Primário) na construção de um modelo para um segundo instrumento (Secundário). Tal método evita a duplicação de custo e esforço experimental no processo de calibração do modelo. Para isso, emprega-se o Algoritmo das Projeções Sucessivas para selecionar variáveis que sejam minimamente redundantes e portem informação relevante nos dois instrumentos. Adicionalmente, é empregado um método de reamostragem e combinação de modelos conhecido como subagging. Para validação do método proposto, apresenta-se um estudo de caso envolvendo a determinação de densidade e temperaturas para 10% e 90% de evaporados em amostras de gasolina, assim como um referente a determinação do teor de umidade em amostras de milho. É apresentado, também, um estudo comparativo com técnicas de transferência baseadas em padronização. Os resultados da técnica proposta se mostraram superiores aos obtidos através da técnica clássica de Mínimos-Quadrados Parciais empregando Padronização Direta por Partes. Em particular, verificou-se que o subagging propicia uma melhora expressiva na capacidade preditiva dos modelos obtidos por regressão linear múltipla. As técnicas propostas se dividem em abordagens no domínio original de comprimento de onda e no domínio da transformada wavelet. O desenvolvimento no domínio wavelet proporcionou uma redução no esforço computacional. Controle de qualidade Combustíveis Espectroscopia no infravermelho Calibração Gasolina Algoritmo das projeções sucessivas Análise de ondas localizadas Análise estatística multivariada Matemática Controle
3	Avaliação do uso de reamostragem e combinação de modelos em regressão linear múltipla empregando o algoritmo das projeções sucessivas. Arlindo Rodrigues Galvão Filho 17 September 2010 (has links) O termo Calibração Multivariada se refere à construção de um modelo matemático que permita prever o valor de uma grandeza de interesse com base em valores medidos de um conjunto de variáveis explicativas. Neste contexto o Algoritmo das Projeções Sucessivas (APS) é uma técnica de seleção de variáveis que objetiva a minimização de problemas de colinearidade em Regressão Linear Múltipla (RLM). Recentemente, constatou-se que a capacidade preditiva de modelos APS-RLM pode ser aprimorada com o uso de um método de reamostragem e combinação de modelos conhecido como subagging. Este trabalho aprofunda o estudo do subagging em conjunto com APS, investigando detalhes que não haviam sido anteriormente contemplados. Para isso, apresenta-se um estudo de caso envolvendo a determinação de umidade e proteína em trigo por espectrometria no infravermelho próximo. Em particular, observa-se que a capacidade preditiva e a sensibilidade a ruído dos modelos resultantes são aprimoradas independentemente da fração de reamostragem adotada no subagging. Adicionalmente, constata-se que o uso de validação cruzada ou validação por série de teste conduzem a resultados similares. Finalmente, tendo em vista o aumento no tempo de cálculo demandado para implementação do subagging, em comparação como APS tradicional, justifica-se o estudo de técnicas para redução da carga computacional envolvida. Neste trabalho propõe-se o uso de uma técnica de regressões sequenciais para facilitar a avaliação de subconjuntos de variáveis na etapa mais demorada do algoritmo. Análise estatística multivariada Calibração Métodos de amostragem Modelos matemáticos Combinações (Matemática) Variáveis (Matemática) Algoritmo das projeções sucessivas Matemática computacional Matemática Computação
4	Algoritmo das projeções sucessivas aplicado à seleção de variáveis em regressão PLS Gomes, Adriano de Araújo 08 March 2012 (has links) Made available in DSpace on 2015-05-14T13:21:12Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 4180515 bytes, checksum: c6359ed912cde60c8848929b44dcca5c (MD5) Previous issue date: 2012-03-08 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Spectroscopy techniques combined with multivariate calibration have allowed the development of methods for analyte determinations (or other properties) in complex matrices. In this context, it can be mentioned the determinations that uses models based on PLS (Partial Least Square) regression, which is well established and consolidated in literature. Is spite of efficiency of PLS models obtained from full spectrum, some papers reported in literature show that a variable selection may improve the predictive ability of the PLS models. In the present work, it was developed an algorithm, in Matlab@, that employs the SPA (Successive Projection Algorithm), originally proposed for MLR (Multiple Linear Regression), in order to improve the predictive ability of interval PLS models. The proposed algorithm, termed iSPA-PLS, was evaluated in three case studies, namely: (i) simultaneous determination of three artificial colorants by UV-VIS spectrometry, (ii) quantification of protein contents in wheat using NIR spectrometry, and (iii) quality determination of samples of beer extract using NIR spectrometry too. The performance of iSPA-PLS was compared to the following well-established algorithms and methods: GA-PLS, PLS-Jack-Knife, iPLS e siPLS. In all applications, the results show that the iSPA-PLS presented some advantageous when compared to other algorithms used for comparison. The main advantageous include the smallest errors of prediction and the capacity of selecting a smaller number of PLS factors. / A combinação de técnicas espectroscópicas com calibração multivariada tem permitido o desenvolvimento de métodos para determinação de analitos (ou outras propriedades) em matrizes complexas. Nesse contexto, destacam-se as determinações usando modelos baseados na regressão PLS (Partial Least Square), bem difundida e consolidada na literatura. Apesar da eficácia dos modelos PLS obtidos a partir de espectros completos, alguns trabalhos da literatura têm mostrado que a seleção de variáveis pode melhorar a capacidade preditiva dos modelos PLS. No presente trabalho, desenvolve-se um algoritmo, em MatLab@, que utiliza o Algoritmo das Projeções Sucessivas-APS, proposto originalmente para MLR (Multiple Linear Regression), a fim de melhorar a capacidade preditiva de modelos PLS obtidos por intervalos. O algoritmo proposto, denominado Algoritmo das projeções sucessivas em intervalos para regressão PLS (iSPA-PLS), foi avaliado em três estudos de caso, a saber: (i) determinação simultânea de três corantes alimentícios em amostras sintéticas usando espectrometria UV-Vis, (ii) quantificação do teor de proteínas em trigo por espectrometria NIR e (iii) determinação da qualidade de amostras de extrato de cervejas usando também espectrometria NIR. O desempenho do iSPA-PLS foi comparado ao dos seguintes algoritmos e modelos bem estabelecidos na literatura: GA-PLS, PLS-Jack-Knife, iPLS e siPLS. Os resultados das três aplicações atestam as vantagens do iSPA-PLS frente aos demais algoritmos. Entre elas, destacam-se os menores erros de predição e a capacidade de selecionar um número menor de fatores PLS. Algoritmo das projeções sucessivas Mínimos quadrados parciais Seleção de variáveis Intervalos Successive projection algorithm Partial least square Variable selection Intervals CIENCIAS EXATAS E DA TERRA::QUIMICA
5	Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas Soares, Sófacles Figueiredo Carreiro 22 September 2010 (has links) Made available in DSpace on 2015-05-14T13:21:51Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 2432134 bytes, checksum: aeda44e0d999a92b980354a5ea66ce01 (MD5) Previous issue date: 2010-09-22 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This study proposes a modification in the Successive Projections Algorithm (SPA), that makes models of Multiple Linear Regression (MLR) more robust in terms of interference. In SPA, subsets of variables are compared based on their root mean square errors for the validation set. By taking into account the statistical prediction error obtained for the calibration set, and dividing by the statistical prediction error obtained for the prediction set, SPA can be improved. Also taken into account is the leverage associated with each sample. Three case studies involving; simulated analytic determinations, food colorants (UV-VIS spectrometry), and ethanol in gasoline (NIR spectrometry) are discussed. The results were evaluated using the root mean square error for an independent prediction set (Root Mean Square Error of Prediction - RMSEP), graphs of the variables, and the statistical tests t and F. The MLR models obtained by the selection using the new function were called SPE-SPA-MLR. When an interferent was present in the prediction spectra, almost all of the models performed better than both SPA-MLR and PLS. The models when compared to SPA-MLR showed that the change promoted better models in all cases giving smaller RMSEPs and variable numbers. The SPE-SPA-MLR was not better in some cases, than PLS models. The variables selected by SPA-SPE-MLR when observed in the spectra were detected in regions where interference was the at its smallest, revealing great potential. The modifications presented here make a useful tool for the basic formulation of the SPA. / Este trabalho propõe uma modificação no Algoritmo das Projeções Sucessivas (Sucessive Projection Algorithm - SPA), com objetivo de aumentar a robustez a interferentes nos modelos de Regressão Linear Múltipla (Multiple Linear Regression - MLR) construídos. Na formulação original do SPA, subconjuntos de variáveis são comparados entre si com base na raiz do erro quadrático médio obtido em um conjunto de validação. De acordo com o critério aqui proposto, a comparação é feita também levando em conta o erro estatístico de previsão (Statistical Prediction Error SPE) obtido para o conjunto de calibração dividido pelo erro estatístico de previsão obtido para o conjunto de previsão. Tal métrica leva em conta a leverage associada a cada amostra. Três estudos de caso envolvendo a determinação de analitos simulados, corantes alimentícios por espectrometria UV-VIS e álcool em gasolinas por espectrometria NIR são discutidos. Os resultados são avaliados em termos da raiz do erro quadrático médio em um conjunto de previsão independente (Root Mean Square Error of Prediction - RMSEP), dos gráficos das variáveis selecionadas e através do testes estatísticos t e F. Os modelos MLR obtidos a partir da seleção usando a nova função custo foram chamados aqui de SPA-SPE-MLR. Estes modelos foram comparados com o SPA-MLR e PLS. Os desempenhos de previsão do SPA-SPEMLR apresentados foram melhores em quase todos os modelos construídos quando algum interferente estava presente nos espectros de previsão. Estes modelos quando comparados ao SPA-MLR, revelou que a mudança promoveu melhorias em todos os casos fornecendo RMSEPs e números de variáveis menores. O SPA-SPE-MLR só não foi melhor que alguns modelos PLS. As variáveis selecionadas pelo SPA-SPE-MLR quando observadas nos espectros se mostraram em regiões onde a ação do interferente foi à menor possível revelando o grande potencial que tal mudança provocou. Desta forma a modificação aqui apresentada pode ser considerada como uma ferramenta útil para a formulação básica do SPA. Regressão linear múltipla Seleção de variáveis Multiple linear regression Variable selection CIENCIAS EXATAS E DA TERRA::QUIMICA
6	Novas estratégias para seleção de variáveis por intervalos em problemas de classificação Fernandes, David Douglas de Sousa 26 August 2016 (has links) Submitted by Maike Costa (maiksebas@gmail.com) on 2017-06-20T13:50:43Z No. of bitstreams: 1 arquivototal.pdf: 7102668 bytes, checksum: abe19d798ad952073affbf4950f62d29 (MD5) / Made available in DSpace on 2017-06-20T13:50:43Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 7102668 bytes, checksum: abe19d798ad952073affbf4950f62d29 (MD5) Previous issue date: 2016-08-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / In Analytical Chemistry it has been recurring in the literature the use of analytical signals recorded on multiple sensors combined with subsequent chemometric modeling for developing new analytical methodologies. For this purpose, it uses generally multivariate instrumental techniques as spectrometry ultraviolet-visible or near infrared, voltammetry, etc. In this scenario, the analyst is faced with the option of selecting individual variables or variable intervals so to avoid or reduce multicollinearity problems. A well-known strategy for selection of variable intervals is to divide the set of instrumental responses into equal width intervals and select the best interval based on the performance of the prediction of a unique range in the regression by Partial Least Squares (iPLS). On the other hand, the use of interval selection for classification purposes has received relatively little attention. A common practice is to use the iPLS regression method with the coded class indices as response variables to be predicted; that is the basic idea behind the release of the Discriminant Analysis by Partial Least Squares (PLS-DA) for classification. In other words, interval selection for classification purposes has no development of native functions (algorithms). Thus, in this work it is proposed two new strategies in classification problems using interval selection by the Successive Projections Algorithm. The first strategy is named Successive Projections Algorithm for selecting intervals in Discriminant Analysis Partial Least Squares (iSPA-PLS-DA), while the second strategy is called Successive Projections Algorithm for selecting intervals in Soft and Independent Modeling by Class Analogy (iSPA-SIMCA). The performance of the proposed algorithms was evaluated in three case studies: classification of vegetable oils according to the type of raw material and the expiration date using data obtained by square wave voltammetry; classification of unadulterated biodiesel/diesel blends (B5) and adulterated with soybean oil (OB5) using spectral data obtained in the ultraviolet-visible region; and classification of vegetable oils with respect to the expiration date using spectral data obtained in the near infrared region. The proposed iSPA-PLS-DA and iSPA-SIMCA algorithms provided good results in the three case studies, with correct classification rates always greater than or equal to those obtained by PLS-DA and SIMCA models using all variables, iPLS-DA and iSIMCA with a single selected interval, as well as SPA-LDA and GA-LDA with selection of individual variables. Therefore, the proposed iSPA-PLS-DA and iSPA-SIMCA algorithms can be considered as promising approaches for use in classification problems employing interval selection. In a more general point of view, the possibility of using interval selection without loss of the classification accuracy can be considered a very useful tool for the construction of dedicated instruments (e.g. LED-based photometers) for use in routine and in situ analysis. / Em Química Analítica tem sido recorrente na literatura o uso de sinais analíticos registrados em múltiplos sensores combinados com posterior modelagem quimiométrica para desenvolvimento de novas metodologias analíticas. Para esta finalidade, geralmente se faz uso de técnicas instrumentais multivariadas como a espectrometrias no ultravioleta-visível ou no infravermelho próximo, voltametria, etc. Neste cenário, o analista se depara com a opção de selecionar variáveis individuais ou intervalos de variáveis de modo de evitar ou diminuir problemas de multicolinearidade. Uma estratégia bem conhecida para seleção de intervalos de variáveis consiste em dividir o conjunto de respostas instrumentais em intervalos de igual largura e selecionar o melhor intervalo com base no critério de desempenho de predição de um único intervalo em regressão por Mínimos Quadrados Parciais (iPLS). Por outro lado, o uso da seleção de intervalo para fins de classificação tem recebido relativamente pouca atenção. Uma prática comum consiste em utilizar o método de regressão iPLS com os índices de classe codificados como variáveis de resposta a serem preditos, que é a idéia básica por trás da versão da Análise Discriminante por Mínimos Quadrados Parciais (PLS-DA) para a classificação. Em outras palavras, a seleção de intervalos para fins de classificação não possui o desenvolvimento de funções nativas (algoritmos). Assim, neste trabalho são propostas duas novas estratégias em problemas de classificação que usam seleção de intervalos de variáveis empregando o Algoritmo das Projeções Sucessivas. A primeira estratégia é denominada de Algoritmo das Projeções Sucessivas para seleção intervalos em Análise Discriminante por Mínimos Quadrados Parciais (iSPA-PLS-DA), enquanto a segunda estratégia é denominada de Algoritmo das Projeções Sucessivas para a seleção de intervalos em Modelagem Independente e Flexível por Analogia de Classe (iSPA-SIMCA). O desempenho dos algoritmos propostos foi avaliado em três estudos de casos: classificação de óleos vegetais com relação ao tipo de matéria-prima e ao prazo de validade utilizando dados obtidos por voltametria de onda quadrada; classificação de misturas biodiesel/diesel não adulteradas (B5) e adulteradas com óleo de soja (OB5) empregando dados espectrais obtidos na região do ultravioleta-visível; e classificação de óleos vegetais com relação ao prazo de validade usando dados espectrais obtidos na região do infravermelho próximo. Os algoritmos iSPA-PLS-DA e iSPA-SIMCA propostos forneceram bons resultados nos três estudos de caso, com taxas de classificação corretas sempre iguais ou superiores àquelas obtidas pelos modelos PLS-DA e SIMCA utilizando todas as variáveis, iPLS-DA e iSIMCA com um único intervalo selecionado, bem como SPA-LDA e GA-LDA com seleção de variáveis individuais. Portanto, os algoritmos iSPA-PLS-DA e iSPA-SIMCA propostos podem ser consideradas abordagens promissoras para uso em problemas de classificação empregando seleção de intervalos de variáveis. Num contexto mais geral, a possibilidade de utilização de seleção de intervalos de variáveis sem perda da precisão da classificação pode ser considerada uma ferramenta bastante útil para a construção de instrumentos dedicados (por exemplo, fotômetros a base de LED) para uso em análise de rotina e de campo. Seleção de intervalos Algoritmo das projeções sucessivas Classificação Interval selection Successive projections algorithm Classification CIENCIAS EXATAS E DA TERRA::QUIMICA
7	Paralelização de algoritmos APS e Firefly para seleção de variáveis em problemas de calibração multivariada / Parallelization of APF and Firefly algorithms for variable selection in multivariate calibration problems Paula, Lauro Cássio Martins de 15 July 2014 (has links) Submitted by Jaqueline Silva (jtas29@gmail.com) on 2014-10-21T18:36:43Z No. of bitstreams: 2 Dissertação - Lauro Cássio Martins de Paula - 2014.pdf: 2690755 bytes, checksum: 3f2c0a7c51abbf9cd88f38ffbe54bb67 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Jaqueline Silva (jtas29@gmail.com) on 2014-10-21T18:37:00Z (GMT) No. of bitstreams: 2 Dissertação - Lauro Cássio Martins de Paula - 2014.pdf: 2690755 bytes, checksum: 3f2c0a7c51abbf9cd88f38ffbe54bb67 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2014-10-21T18:37:00Z (GMT). No. of bitstreams: 2 Dissertação - Lauro Cássio Martins de Paula - 2014.pdf: 2690755 bytes, checksum: 3f2c0a7c51abbf9cd88f38ffbe54bb67 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Previous issue date: 2014-07-15 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The problem of variable selection is the selection of attributes for a given sample that best contribute to the prediction of the property of interest. Traditional algorithms as Successive Projections Algorithm (APS) have been quite used for variable selection in multivariate calibration problems. Among the bio-inspired algorithms, we note that the Firefly Algorithm (AF) is a newly proposed method with potential application in several real world problems such as variable selection problem. The main drawback of these tasks lies in them computation burden, as they grow with the number of variables available. The recent improvements of Graphics Processing Units (GPU) provides to the algorithms a powerful processing platform. Thus, the use of GPUs often becomes necessary to reduce the computation time of the algorithms. In this context, this work proposes a GPU-based AF (AF-RLM) for variable selection using multiple linear regression models (RLM). Furthermore, we present two APS implementations, one using RLM (APSRLM) and the other sequential regressions (APS-RS). Such implementations are aimed at improving the computational efficiency of the algorithms. The advantages of the parallel implementations are demonstrated in an example involving a large number of variables. In such example, gains of speedup were obtained. Additionally we perform a comparison of AF-RLM with APS-RLM and APS-RS. Based on the results obtained we show that the AF-RLM may be a relevant contribution for the variable selection problem. / O problema de seleção de variáveis consiste na seleção de atributos de uma determinada amostra que melhor contribuem para a predição da propriedade de interesse. O Algoritmo das Projeções Sucessivas (APS) tem sido bastante utilizado para seleção de variáveis em problemas de calibração multivariada. Entre os algoritmos bioinspirados, nota-se que o Algoritmo Fire f ly (AF) é um novo método proposto com potencial de aplicação em vários problemas do mundo real, tais como problemas de seleção de variáveis. A principal desvantagem desses dois algoritmos encontra-se em suas cargas computacionais, conforme seu tamanho aumenta com o número de variáveis. Os avanços recentes das Graphics Processing Units (GPUs) têm fornecido para os algoritmos uma poderosa plataforma de processamento e, com isso, sua utilização torna-se muitas vezes indispensável para a redução do tempo computacional. Nesse contexto, este trabalho propõe uma implementação paralela em GPU de um AF (AF-RLM) para seleção de variáveis usando modelos de Regressão Linear Múltipla (RLM). Além disso, apresenta-se duas implementações do APS, uma utilizando RLM (APS-RLM) e uma outra que utiliza a estratégia de Regressões Sequenciais (APS-RS). Tais implementações visam melhorar a eficiência computacional dos algoritmos. As vantagens das implementações paralelas são demonstradas em um exemplo envolvendo um número relativamente grande de variáveis. Em tal exemplo, ganhos de speedup foram obtidos. Adicionalmente, realiza-se uma comparação do AF-RLM com o APS-RLM e APS-RS. Com base nos resultados obtidos, mostra-se que o AF-RLM pode ser uma contribuição relevante para o problema de seleção de variáveis. Algoritmo das projeções sucessivas Seleção de variáveis Calibração multivariada GPU Regressão linear múltipla Algoritmo firefly Successive projections algorithm Variable selection Multivariate calibration Multiple linear regression Firefly algorithm

1

Page generated in 0.1064 seconds