Spelling suggestions: "subject:"detecção dde mudança dde conceito"" "subject:"detecção dde mudança dde conceitos""
1 |
Detecção de mudança de conceito baseada em aprendizado ativoCosta, Albert França Josuá, 68-99211-7175 11 December 2017 (has links)
Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2018-03-02T13:31:20Z
No. of bitstreams: 2
Dissertação_Albert F. J. Costa.pdf: 4215192 bytes, checksum: 995a811676e714bffa60b5d73a387cfa (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2018-03-02T13:31:36Z (GMT) No. of bitstreams: 2
Dissertação_Albert F. J. Costa.pdf: 4215192 bytes, checksum: 995a811676e714bffa60b5d73a387cfa (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-03-02T13:31:36Z (GMT). No. of bitstreams: 2
Dissertação_Albert F. J. Costa.pdf: 4215192 bytes, checksum: 995a811676e714bffa60b5d73a387cfa (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2017-12-11 / FAPEAM - Fundação de Amparo à Pesquisa do Estado do Amazonas / Current machine learning techniques used for prediction tasks rely on the assumption that the environment where data is generated is static and supervised. However, most of the real-world problems present dynamic and semi-supervised environments, which invalidate this assumed assumption. In these environments, it is possible the occurrence of a phenomenon known in the literature as concept drift. The main characteristic of such a phenomenon is that the relationship between instances’ features and their true classes changes over time. The primary effect of the concept drift occurrence is the decrease on classifier performance, which leads the classifier to be obsolete for the task. There are methods in the literature that deal with concept drift implicitly or explicitly. The main drawback to blind (implicit) methods is the cost on retraining the classifier constantly, even with no concept drift occurrence, while the informed (explicit) methods generally work based on classifier performance decrease, or based on assumptions about the samples distribution. In order to try to overcome these drawbacks, in this work we propose to use density variation of the most significant instances as an explicit trigger for concept drift detection. Density variation measurement is based on Active Learning, and is calculated from virtual margins projected onto the input space according to the classifier confidence. Focusing on demonstrating the validity of the proposed method, called Concept Drift Detection Method Based on Active Learning (DMAA), were have carried out experiments divided into two series. In the first series, DMAA was investigated on six databases, which represent four synthetic and two real problems. The obtained results show that the proposed method achieved 95.45% of drift detection rate on synthetic databases, and 16.5% as mean error rate in both synthetic and real databases. In the second series of experiments, DMAA was compared to three baselines, including two supervised drift detectors and one Active Learning-based method. The obtained results show that DMAA reached statistically significant better recognition rates in the majority of databases. Besides, it reduced the amount of labeled instances needed to keep the system updated. / As atuais técnicas de aprendizado de máquina aplicadas na tarefa de predição são baseadas na premissa de que o ambiente em que os dados são gerados apresenta um comportamento estacionário e supervisionado. Porém, os ambientes, na maioria dos problemas do mundo real, são considerados dinâmicos e semi-supervisionados, fatos que invalidam as premissas normalmente utilizadas. Nesses ambientes há a possibilidade da ocorrência do fenômeno conhecido na literatura por mudança de conceito (do inglês concept drift), que caracteriza-se pela alteração na relação entre as características das instâncias e a sua verdadeira classe com a passagem do tempo. Como efeito primário da ocorrência desse fenômeno tem-se a degradação significativa na taxa de desempenho do classificador, tornando-o obsoleto para a tarefa. Encontram-se na literatura métodos que lidam implicitamente ou explicitamente com a mudança de conceito, sendo que os métodos cegos (implícitos) arcam com os custos de retreinar o classificador de forma constante, enquanto que os métodos informados (explícitos) atuam normalmente baseados no monitoramento da degradação do desempenho do classificador, ou na realização de suposições sobre a distribuição das instâncias. Para contornar essas dificuldades, esta dissertação propõe o uso da variação da densidade das instâncias mais significativas, calculada com base em Aprendizado Ativo, como sinalizador explícito da ocorrência de mudança de conceito. A densidade é mensurada a partir do conceito de margens virtuais projetadas no espaço de entrada, sendo que as margens virtuais são obtidas com base na incerteza do classificador. Objetivando-se demonstrar a validade do método proposto, denominado de Método de Detecção de Mudança de Conceito Baseada em Aprendizado Ativo (DMAA), experimentos foram realizados em duas etapas. A primeira consistiu na aplicação do DMAA em seis bases de dados, sendo quatro sintéticas e duas reais. Os resultados obtidos demonstram que o método proposto identificou em média 95,45% das mudanças existentes nas bases sintéticas, e alcançou uma média geral de erro de 16,5%. Na segunda etapa de experimentos, foi feita uma comparação entre o DMAA e três baselines, incluindo dois métodos supervisionados e um método baseado em aprendizado ativo. Os resultados indicam que o DMAA alcançou resultados estatisticamente superiores em mais da metade das bases de dados investigadas, além de reduzir significativamente a quantidade de instâncias rotuladas necessárias para manter o sistema atualizado.
|
2 |
Sistema automático para negociação de ações usando técnica de mineração de dados com detecção de mudança de conceitoSOUZA, Victor Lorena de Farias 19 October 2015 (has links)
Submitted by Haroudo Xavier Filho (haroudo.xavierfo@ufpe.br) on 2016-01-22T14:22:26Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação_Mestrado_Victor_Lorena.pdf: 1644188 bytes, checksum: 4a53bf1f4dc89599b68bd29f20b7fd59 (MD5) / Made available in DSpace on 2016-01-22T14:22:26Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação_Mestrado_Victor_Lorena.pdf: 1644188 bytes, checksum: 4a53bf1f4dc89599b68bd29f20b7fd59 (MD5)
Previous issue date: 2015-10-19 / FACEPE / Uma série temporal financeira representa as cotações dos preços das ações e apresenta
comportamento similar a um fluxo de dados. Para a descoberta de padrões presentes em seus
dados alguns trabalhos utilizam técnicas de mineração de dados que são fundamentadas na
ideia de que os dados históricos guardam a memória essencial para prever a direção futura
dos preços. Métodos tradicionais propostos na literatura consideram que o ambiente é estático,
ou seja, que o mecanismo gerador da série financeira é o mesmo durante todo o intervalo de
tempo de interesse. Porém, no caso de séries temporais financeiras, isso pode não ocorrer. Para
resolver este problema, esta dissertação propõe a abordagem PAA-IDPSO-CD (Aproximação
por Valor Agregado de Segmento - Otimização por Enxame de Partículas Auto Adaptativa com
detecção de mudança de conceito) para descoberta de padrões em séries temporais financeiras. A
abordagem proposta objetiva lidar explicitamente com mudanças de conceito na série e descobrir
os melhores padrões representativos dos dados das séries temporais que serão utilizados junto
a uma estratégia de investimento formulada para automatizar as operações a serem feitas no
mercado de ações. Isso possibilitará a redução das incertezas e dos riscos envolvidos nas compras
e vendas de ações e auxiliará os investidores a maximizar o lucro nas suas operações feitas no
mercado de ações. A fim de alcançar melhores resultados são propostas diferentes estruturas
de partículas, utilizadas pelo IDPSO, junto a diferentes regras de decisão. Primeiramente, é
utilizada uma estrutura básica para a partícula, em que se opera apenas na posição comprado no
mercado financeiro. É proposto também uma segunda estrutura que é capaz de operar tanto na
posição comprado quanto na posição vendido. Os experimentos do presente estudo comparam os
resultados das versões do método proposto entre si e com os resultados obtidos pelas abordagens
Buy and Hold (B&H) e SAX-GA (Aproximação por Valor Agregado Simbólico - Algoritmos
Genéticos). Para isso, foram realizados Teste t Pareado com nível de confiança de 95% em vinte
ações. O presente estudo conclui que o PAA-IDPSO-CD apresentou resultados estatisticamente
melhores que o B&H e o SAX-GA para todas as vinte ações em que os testes foram executados
(pvalor <0;05). Além disso, a estratégia que opera nas posições comprado e vendido é melhor
quando comparada àquela que opera apenas na posição comprado. No estudo comparativo em
onze ações não houve diferença estatística e em outras sete a estratégia comprado e vendido
obteve melhores resultados (pvalor < 0; 05). / Financial time series represents the prices of stock over time and presents similar behavior
to a data stream. Mining techniques, which are based on the idea that the historical data retain
the essential memory to predict the future direction, are used to make the patterns discovery
in the time series data. In this context, this study proposes the PAA-IDPSO-CD (Piecewise
Aggregate Approximation - Improved self-adaptive particle swarm optimization with Concept
Drift) approach aiming to find patterns in financial time series. The purpose of this study is the
discovery of the best representative patterns of the time series data to be used by a designed
investment strategy to automate the operations to be made in the stock market. Thus, reducing
the uncertainties and risks involved in buying and selling operations of stocks and help investors
maximize the profit in their operations made in the stock market. In order to achieve best
results, different particle structures, used by IDPSO, along with different decision rules are
proposed. First, a basic structure to the particle is employed, it operates only in the Long position
in the financial market. Subsequently, this structure develops to be able to operate both in
Long and Short position. The experiments of this study comparing the results of the various
versions of the proposed approach with each other and with those obtained by the Buy and
Hold (B&H) and SAX-GA techniques, for that, were performed Paired t test with a confidence
level of 95% in twenty stocks. The achieved results show that the PAA-IDPSO-CD outperforms
B&H and SAX-GA for all twenty stocks in which the tests were performed (pvalue < 0:05).
Furthermore, the long-short operating strategy is better than that operating only in the long
position. In the comparative study in eleven actions there was no statistical difference and in
other seven long-short strategy outperforms (pvalue < 0:05).
|
Page generated in 0.0582 seconds