[pt] A previsão de movimentos futuros para o mercado de ações é conhecidamente uma tarefa difícil de ser satisfatoriamente realizada. Além disso, a
própria possibilidade desta previsão é constantemente questionada na literatura. O estudo presente investiga se essa dificuldade poderia ser amenizada
escolhendo janelas específicas de tempo, onde uma dinâmica mais evidente
prevaleça, e se a identificação desses períodos pode ser aprendida através de
dados passados. Um framework é proposto para tratar desses problemas.
Esse framework é nomeado de Predictability Crawler (P-Craw). A proposta
usa rotinas de otimização como o Particle Swarm Optimization (PSO) e
Algorítimos Genéticos (GA) para selecionar sub-conjuntos de dados históricos
onde modelos de aprendizado estatístico possam ser treinados de forma mais
eficiente.
Para validar a acurácia do método, este é testado em dois diferentes conjuntos
de dados. Primeiro, simulações com diferentes níveis de ruído são geradas.
Nelas, o P-Craw é capaz de identificar os subconjuntos ótimos em cenários
com 20 por cento a 100 por cento de amostras previsíveis. Por fim, dados de transações intradiárias da bolsa de valores brasileira (BOVESPA) são agregados e processados
uma matrix de variáveis de entrada e um vetor de previsões. Quando o
P-Craw é testado contra o método usual de treinar os modelos em todo
conjunto histórico disponível nos dados da BOVESPA, o framework é capaz de
aumentar significativamente o número de vezes que o modelo acerta a direção
do movimento do preço das ações, enquanto consegue chegar a reduzir em até
19 por cento o erro médio absoluto da tarefa. / [en] Predicting stock movements in the market its known to be an extremely
difficult task. More than that, the predictability of the series itself is a
controversial matter. The present study investigates if this difficulty could
be alleviated by choosing specific windows of time where a more structured
dynamic prevails, and whether the identification of those moments could be
learned from past data. In order to do that, a novel framework is proposed.
This framework is called the Predictability Crawler (P-Craw). It uses optimizations routines such as the Particle Swarm Optimization (PSO) or Genetic
Algorithms (GA) to select subsets of historical data where statistical learning
algorithms can be more efficiently trained.
To access the accuracy of the method, it is tested against two different datasets.
First, simulated data with varying percentage of noise is generated and used. In
the simulations, The P-Craw is able to reliably identify the optimal subsets in
scenarios ranging from 20 percent to 100 percent of predictable samples in the data. Second,
intraday data from the Brazilian stocks exchange (BOVESPA) is collected
and aggregated into feature and target matrices. When benchmarked against
training with the whole samples in the BOVESPA data, the framework is able
to significantly raise the correct directional changes of the trained models while
reducing the Mean Absolute Error in up to 19 percent.
Identifer | oai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:47988 |
Date | 11 May 2020 |
Creators | RODRIGO CANTO CORBELLI |
Contributors | MARLEY MARIA BERNARDES REBUZZI VELLASCO |
Publisher | MAXWELL |
Source Sets | PUC Rio |
Language | English |
Detected Language | Portuguese |
Type | TEXTO |
Page generated in 0.0023 seconds