Global ETD Search

1	Detecção de mudança de conceito baseada em aprendizado ativo Costa, Albert França Josuá, 68-99211-7175 11 December 2017 (has links) Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2018-03-02T13:31:20Z No. of bitstreams: 2 Dissertação_Albert F. J. Costa.pdf: 4215192 bytes, checksum: 995a811676e714bffa60b5d73a387cfa (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2018-03-02T13:31:36Z (GMT) No. of bitstreams: 2 Dissertação_Albert F. J. Costa.pdf: 4215192 bytes, checksum: 995a811676e714bffa60b5d73a387cfa (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-03-02T13:31:36Z (GMT). No. of bitstreams: 2 Dissertação_Albert F. J. Costa.pdf: 4215192 bytes, checksum: 995a811676e714bffa60b5d73a387cfa (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017-12-11 / FAPEAM - Fundação de Amparo à Pesquisa do Estado do Amazonas / Current machine learning techniques used for prediction tasks rely on the assumption that the environment where data is generated is static and supervised. However, most of the real-world problems present dynamic and semi-supervised environments, which invalidate this assumed assumption. In these environments, it is possible the occurrence of a phenomenon known in the literature as concept drift. The main characteristic of such a phenomenon is that the relationship between instances’ features and their true classes changes over time. The primary effect of the concept drift occurrence is the decrease on classifier performance, which leads the classifier to be obsolete for the task. There are methods in the literature that deal with concept drift implicitly or explicitly. The main drawback to blind (implicit) methods is the cost on retraining the classifier constantly, even with no concept drift occurrence, while the informed (explicit) methods generally work based on classifier performance decrease, or based on assumptions about the samples distribution. In order to try to overcome these drawbacks, in this work we propose to use density variation of the most significant instances as an explicit trigger for concept drift detection. Density variation measurement is based on Active Learning, and is calculated from virtual margins projected onto the input space according to the classifier confidence. Focusing on demonstrating the validity of the proposed method, called Concept Drift Detection Method Based on Active Learning (DMAA), were have carried out experiments divided into two series. In the first series, DMAA was investigated on six databases, which represent four synthetic and two real problems. The obtained results show that the proposed method achieved 95.45% of drift detection rate on synthetic databases, and 16.5% as mean error rate in both synthetic and real databases. In the second series of experiments, DMAA was compared to three baselines, including two supervised drift detectors and one Active Learning-based method. The obtained results show that DMAA reached statistically significant better recognition rates in the majority of databases. Besides, it reduced the amount of labeled instances needed to keep the system updated. / As atuais técnicas de aprendizado de máquina aplicadas na tarefa de predição são baseadas na premissa de que o ambiente em que os dados são gerados apresenta um comportamento estacionário e supervisionado. Porém, os ambientes, na maioria dos problemas do mundo real, são considerados dinâmicos e semi-supervisionados, fatos que invalidam as premissas normalmente utilizadas. Nesses ambientes há a possibilidade da ocorrência do fenômeno conhecido na literatura por mudança de conceito (do inglês concept drift), que caracteriza-se pela alteração na relação entre as características das instâncias e a sua verdadeira classe com a passagem do tempo. Como efeito primário da ocorrência desse fenômeno tem-se a degradação significativa na taxa de desempenho do classificador, tornando-o obsoleto para a tarefa. Encontram-se na literatura métodos que lidam implicitamente ou explicitamente com a mudança de conceito, sendo que os métodos cegos (implícitos) arcam com os custos de retreinar o classificador de forma constante, enquanto que os métodos informados (explícitos) atuam normalmente baseados no monitoramento da degradação do desempenho do classificador, ou na realização de suposições sobre a distribuição das instâncias. Para contornar essas dificuldades, esta dissertação propõe o uso da variação da densidade das instâncias mais significativas, calculada com base em Aprendizado Ativo, como sinalizador explícito da ocorrência de mudança de conceito. A densidade é mensurada a partir do conceito de margens virtuais projetadas no espaço de entrada, sendo que as margens virtuais são obtidas com base na incerteza do classificador. Objetivando-se demonstrar a validade do método proposto, denominado de Método de Detecção de Mudança de Conceito Baseada em Aprendizado Ativo (DMAA), experimentos foram realizados em duas etapas. A primeira consistiu na aplicação do DMAA em seis bases de dados, sendo quatro sintéticas e duas reais. Os resultados obtidos demonstram que o método proposto identificou em média 95,45% das mudanças existentes nas bases sintéticas, e alcançou uma média geral de erro de 16,5%. Na segunda etapa de experimentos, foi feita uma comparação entre o DMAA e três baselines, incluindo dois métodos supervisionados e um método baseado em aprendizado ativo. Os resultados indicam que o DMAA alcançou resultados estatisticamente superiores em mais da metade das bases de dados investigadas, além de reduzir significativamente a quantidade de instâncias rotuladas necessárias para manter o sistema atualizado. Detecção de Mudança de Conceito Aprendizado Ativo Margens Virtuais
2	Sistema automático para negociação de ações usando técnica de mineração de dados com detecção de mudança de conceito SOUZA, Victor Lorena de Farias 19 October 2015 (has links) Submitted by Haroudo Xavier Filho (haroudo.xavierfo@ufpe.br) on 2016-01-22T14:22:26Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Dissertação_Mestrado_Victor_Lorena.pdf: 1644188 bytes, checksum: 4a53bf1f4dc89599b68bd29f20b7fd59 (MD5) / Made available in DSpace on 2016-01-22T14:22:26Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Dissertação_Mestrado_Victor_Lorena.pdf: 1644188 bytes, checksum: 4a53bf1f4dc89599b68bd29f20b7fd59 (MD5) Previous issue date: 2015-10-19 / FACEPE / Uma série temporal financeira representa as cotações dos preços das ações e apresenta comportamento similar a um fluxo de dados. Para a descoberta de padrões presentes em seus dados alguns trabalhos utilizam técnicas de mineração de dados que são fundamentadas na ideia de que os dados históricos guardam a memória essencial para prever a direção futura dos preços. Métodos tradicionais propostos na literatura consideram que o ambiente é estático, ou seja, que o mecanismo gerador da série financeira é o mesmo durante todo o intervalo de tempo de interesse. Porém, no caso de séries temporais financeiras, isso pode não ocorrer. Para resolver este problema, esta dissertação propõe a abordagem PAA-IDPSO-CD (Aproximação por Valor Agregado de Segmento - Otimização por Enxame de Partículas Auto Adaptativa com detecção de mudança de conceito) para descoberta de padrões em séries temporais financeiras. A abordagem proposta objetiva lidar explicitamente com mudanças de conceito na série e descobrir os melhores padrões representativos dos dados das séries temporais que serão utilizados junto a uma estratégia de investimento formulada para automatizar as operações a serem feitas no mercado de ações. Isso possibilitará a redução das incertezas e dos riscos envolvidos nas compras e vendas de ações e auxiliará os investidores a maximizar o lucro nas suas operações feitas no mercado de ações. A fim de alcançar melhores resultados são propostas diferentes estruturas de partículas, utilizadas pelo IDPSO, junto a diferentes regras de decisão. Primeiramente, é utilizada uma estrutura básica para a partícula, em que se opera apenas na posição comprado no mercado financeiro. É proposto também uma segunda estrutura que é capaz de operar tanto na posição comprado quanto na posição vendido. Os experimentos do presente estudo comparam os resultados das versões do método proposto entre si e com os resultados obtidos pelas abordagens Buy and Hold (B&H) e SAX-GA (Aproximação por Valor Agregado Simbólico - Algoritmos Genéticos). Para isso, foram realizados Teste t Pareado com nível de confiança de 95% em vinte ações. O presente estudo conclui que o PAA-IDPSO-CD apresentou resultados estatisticamente melhores que o B&H e o SAX-GA para todas as vinte ações em que os testes foram executados (pvalor <0;05). Além disso, a estratégia que opera nas posições comprado e vendido é melhor quando comparada àquela que opera apenas na posição comprado. No estudo comparativo em onze ações não houve diferença estatística e em outras sete a estratégia comprado e vendido obteve melhores resultados (pvalor < 0; 05). / Financial time series represents the prices of stock over time and presents similar behavior to a data stream. Mining techniques, which are based on the idea that the historical data retain the essential memory to predict the future direction, are used to make the patterns discovery in the time series data. In this context, this study proposes the PAA-IDPSO-CD (Piecewise Aggregate Approximation - Improved self-adaptive particle swarm optimization with Concept Drift) approach aiming to find patterns in financial time series. The purpose of this study is the discovery of the best representative patterns of the time series data to be used by a designed investment strategy to automate the operations to be made in the stock market. Thus, reducing the uncertainties and risks involved in buying and selling operations of stocks and help investors maximize the profit in their operations made in the stock market. In order to achieve best results, different particle structures, used by IDPSO, along with different decision rules are proposed. First, a basic structure to the particle is employed, it operates only in the Long position in the financial market. Subsequently, this structure develops to be able to operate both in Long and Short position. The experiments of this study comparing the results of the various versions of the proposed approach with each other and with those obtained by the Buy and Hold (B&H) and SAX-GA techniques, for that, were performed Paired t test with a confidence level of 95% in twenty stocks. The achieved results show that the PAA-IDPSO-CD outperforms B&H and SAX-GA for all twenty stocks in which the tests were performed (pvalue < 0:05). Furthermore, the long-short operating strategy is better than that operating only in the long position. In the comparative study in eleven actions there was no statistical difference and in other seven long-short strategy outperforms (pvalue < 0:05). Descoberta de padrões Reconhecimento de padrões Mineração de dados Representação PAA Otimização por enxame de partículas Detecção de mudança de conceito Mercado de ações

Search results

Detecção de mudança de conceito baseada em aprendizado ativo

Sistema automático para negociação de ações usando técnica de mineração de dados com detecção de mudança de conceito