Neste trabalho os retornos de ativos financeiros são modelados com base em dados não-estruturados de notícias aperiódicas. O cerne do tratamento de tais dados está na Recuperação da Informação, que se importa em aplicar uma transformação suficientemente representativa das estruturas de contexto gramatical para o algébrico. Trabalhos anteriores mostram que não só o timing (GOODHART, HALL, et al., 1993), tipo (ÄIJÖ, 2008), ou contexto no momento de publicação da notícia (BEBER e BRANDT, 2010), mas também o conteúdo léxico (WÜTHRICH, PERMUNETILLEKE, et al., 1998; LAVRENKO, SCHMILL, et al., 2000; SCHUMAKER e CHEN, 2009) explicam movimentos de mercado. Este trabalho tem por objetivo estender a discussão já fundamentada sobre a semântica das publicações, com a proposta de aprofundar a avaliação da sensibilidade paramétrica do ajuste de modelos já encontrados na literatura. Questões sobre a metodologia de pré-processamento dos textos são exploradas por meio de diversos experimentos. Por fim, corrobora-se os resultados prévios sobre a possibilidade de aplicar-se uma classificação preditiva sobre movimentos do mercado acionário norte-americano, particularmente dentro da janela de 15 a 25 minutos após a publicação de um press release. Contudo, não são encontradas evidências com de que regressão tenha a mesma capacidade, nem de que exista antecipação pelo mercado da informação a ser anunciada. / In this paper the returns of financial assets are modeled based on data from unstructured aperiodic news. The core processing of such data in is information retrieval, which deals with applying a transformation sufficiently representative from structures of grammatical to algebraic contexts. Previous works show that not only the news timing (GOODHART, HALL, et al., 1993), its type (ÄIJÖ, 2008), or its context in the moment of announcement (BEBER e BRANDT, 2010), but also its lexical content (WÜTHRICH, PERMUNETILLEKE, et al., 1998; LAVRENKO, SCHMILL, et al., 2000; SCHUMAKER e CHEN, 2009) explain movements on the market. This work aims to extend the ongoing discussion over the semantics of publications, with the proposal of further evaluating the sensitivity of the model\'s parametric fitting found in the literature. Questions raised about the methodology of pre-processing of texts are explored through various experiments. Finally, previous results on the possibility of applying a predictive classification of the U.S. stock market movements are corroborated, particularly inside a time frame from 15 to 25 minutes after the publication of a press release. However, no evidence is found with ? <= 0.01 that regression has the same capacity, nor that there is anticipation of market information to be announced.
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-04042012-195555 |
Date | 07 February 2012 |
Creators | Daniel Bittencourt Silva |
Contributors | Cesar Alexandre de Souza, Christian Johannes Zimmer |
Publisher | Universidade de São Paulo, Administração, USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.002 seconds