Global ETD Search

Return to search

A methodology for improving computed individual regressions predictions. / Uma metodologia para melhorar predições individuais de regressões.

This research proposes a methodology to improve computed individual prediction values provided by an existing regression model without having to change either its parameters or its architecture. In other words, we are interested in achieving more accurate results by adjusting the calculated regression prediction values, without modifying or rebuilding the original regression model. Our proposition is to adjust the regression prediction values using individual reliability estimates that indicate if a single regression prediction is likely to produce an error considered critical by the user of the regression. The proposed method was tested in three sets of experiments using three different types of data. The first set of experiments worked with synthetically produced data, the second with cross sectional data from the public data source UCI Machine Learning Repository and the third with time series data from ISO-NE (Independent System Operator in New England). The experiments with synthetic data were performed to verify how the method behaves in controlled situations. In this case, the outcomes of the experiments produced superior results with respect to predictions improvement for artificially produced cleaner datasets with progressive worsening with the addition of increased random elements. The experiments with real data extracted from UCI and ISO-NE were done to investigate the applicability of the methodology in the real world. The proposed method was able to improve regression prediction values by about 95% of the experiments with real data. / Esta pesquisa propõe uma metodologia para melhorar previsões calculadas por um modelo de regressão, sem a necessidade de modificar seus parâmetros ou sua arquitetura. Em outras palavras, o objetivo é obter melhores resultados por meio de ajustes nos valores computados pela regressão, sem alterar ou reconstruir o modelo de previsão original. A proposta é ajustar os valores previstos pela regressão por meio do uso de estimadores de confiabilidade individuais capazes de indicar se um determinado valor estimado é propenso a produzir um erro considerado crítico pelo usuário da regressão. O método proposto foi testado em três conjuntos de experimentos utilizando três tipos de dados diferentes. O primeiro conjunto de experimentos trabalhou com dados produzidos artificialmente, o segundo, com dados transversais extraídos no repositório público de dados UCI Machine Learning Repository, e o terceiro, com dados do tipo séries de tempos extraídos do ISO-NE (Independent System Operator in New England). Os experimentos com dados artificiais foram executados para verificar o comportamento do método em situações controladas. Nesse caso, os experimentos alcançaram melhores resultados para dados limpos artificialmente produzidos e evidenciaram progressiva piora com a adição de elementos aleatórios. Os experimentos com dados reais extraído das bases de dados UCI e ISO-NE foram realizados para investigar a aplicabilidade da metodologia no mundo real. O método proposto foi capaz de melhorar os valores previstos por regressões em cerca de 95% dos experimentos realizados com dados reais.

http://www.teses.usp.br/teses/disponiveis/3/3142/tde-12052016-140407/

Aprendizado de máquinas

Artificial neural networks

Dados desbalanceados

Imbalanced datasets

Improvement of regression predictions

Individual reliability estimates

Machine learning

Máquina de comitê de redes neurais

Melhoria em previsões de regressões

Neural networks committee machine

Pattern recognition

Reconhecimento de padrões

Redes neurais artificiais

Identifer	oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-12052016-140407
Date	23 October 2015
Creators	Matsumoto, Élia Yathie
Contributors	Hernandez, Emilio Del Moral
Publisher	Biblioteca Digitais de Teses e Dissertações da USP
Source Sets	Universidade de São Paulo
Language	English
Detected Language	English
Type	Tese de Doutorado
Format	application/pdf
Rights	Liberar o conteúdo para acesso público.

Page generated in 0.0025 seconds

A methodology for improving computed individual regressions predictions. / Uma metodologia para melhorar predições individuais de regressões.

Description

Links & Downloads

Tags

Additional Fields