Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2009. / Made available in DSpace on 2012-10-24T09:26:05Z (GMT). No. of bitstreams: 1
275533.pdf: 1005019 bytes, checksum: c0f34ed360b28b84cefee8ff97365a04 (MD5) / Devido a sua grande capacidade representacional, as Redes Neurais Artificiais (RNAs) têm sido largamente utilizadas como aproximadores universais de funções na construção de modelos preditivos não-lineares, inclusive em aplicações da indústria petrolífera. Contudo, devido à natureza estocástica do treinamento das RNAs, indicadores de qualidade e confiabilidade para as saídas destes modelos, como os intervalos de predição, são extremamente necessários e desempenham um papel importante em aplicações reais. Muitas das técnicas adotadas para o cálculo dos intervalos de predição estabelecem uma série de restrições que devem ser atendidas pelos dados amostrais usados para treinar a RNA. Uma dessas restrições impõe que a variância dos resíduos seja constante, fato que nem sempre ocorre em aplicações reais, onde a taxa de ruído existente pode variar como função dos dados de entrada, fazendo com que a confiabilidade calculada pelos métodos tradicionais não seja condizente com a real precisão da rede neural. Nesta dissertação, uma extensão para um método de cálculo de intervalos de predição para redes neurais baseado na teoria da regressão não-linear é apresentada. A idéia principal do método proposto consiste em utilizar técnicas de agrupamento para estimar a variância dos resíduos em função do vetor de entrada apresentado à rede e incorporar essa estimativa ao cálculo dos intervalos de predição. Os resultados dos experimentos realizados mostram que tal abordagem pode gerar intervalos de predição com uma melhor representação da precisão das respostas das RNAs. / Due to their large representational capacity, Artificial Neural Networks (ANNs) have been widely used as universal approximators of functions in the construction of nonlinear predictive models, including oil industry applications. However, due to the stochastic nature of the ANN training, indicators of quality and reliability to the outputs of these models, such as the prediction intervals, are extremely necessary and play an important role in real applications. Many of the techniques adopted to calculate the prediction intervals impose a set of constraints that must be respected by the data sample used to train the ANN. One of these restrictions requires that the variance of the residuals must be constant, a fact that does not always occur in real applications, where the existent noise rate may vary as a function of input data, making the reliability calculated by traditional methods become not suitable with the actual accuracy of the neural network.
In this work, an extension to a method for calculating prediction intervals for neural networks, based on the theory of nonlinear regression, is presented. The main idea of the proposed method is to estimate an input dependent variance of the residuals using clustering techniques and incorporate this estimate to the computation of the prediction intervals. The results of the performed experiments show that this approach can lead to prediction intervals which better represent the accuracy of the ANNs outputs.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufsc.br:123456789/92496 |
Date | 24 October 2012 |
Creators | Neves, Cícero Augusto Magalhães da Silva |
Contributors | Universidade Federal de Santa Catarina, Roisenberg, Mauro |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | x, 68 f.| grafs., tabs. |
Source | reponame:Repositório Institucional da UFSC, instname:Universidade Federal de Santa Catarina, instacron:UFSC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0014 seconds