根據過去研究指出,社群網站上的貼文訊息會對群眾情緒造成影響,進而影響股市波動,故對於投資者而言,如果能快速分析大量社群網站的財經文本來推測投資情緒進而預測股市走勢,將可提升投資獲利。
過去文本情感分析的研究中已證實監督式學習方法可以透過簡單量化的方式達到良好的分類效果,但監督式學習方法所使用的訓練資料集須有事先定義好的已知類別,故其有無法預期未知類別的限制,所以本研究透過深度學習方法,從巨量資料及裡抓出有關於股市之文章,並透過財經文本的混合監督式學習與非監督式學習之情感分析方法,透過非監督式學習對微博財經貼文進行文本主題判別、情緒指數計算與情緒傾向標注,並且透過監督式學習的方式,建立分類模型以預測上海指數走勢,最後配合視覺化工具作趨勢線圖分析,找出具有領先指標特性之主題。
在實驗結果中,深度學習方面,本研究透過word2vec抓取有效之股市主題文章,有效篩選了需要分析之文本,主題模型方面,我們最後使用LDA作為本研究標註主題之方法,因為其文本數量大於議題詞數量造成TFIDF矩陣過於稀疏,造成Kmeans分群效果不佳,故後續採用LDA主題模型進行主題標注。情緒傾向標注方面,透過擴充後的情感詞集比起NTUSD有更好的詞性分數判斷效果,計算出的情緒指數之趨勢線能有效預測上海指數之趨勢。此外,並非所有主題模型之情緒指數皆具有領先特性,僅公司表現與上海指數之主題模型的情緒指數能提前反應上海指數趨勢,故本研究用此二主題之文本的情緒指數來建立分類模型。
本研究透過比較情緒指數與單純指數指標分類模型的準確度,前者較後者高出7%的準確率。故證實了情感分析確實能有效提升上海指數趨勢預測準確度,幫助投資者增加股市報酬率。
Identifer | oai:union.ndltd.org:CHENGCHI/G0103356002 |
Creators | 蔡宇祥, Tsai, Yu Shiang |
Publisher | 國立政治大學 |
Source Sets | National Chengchi University Libraries |
Language | 中文 |
Detected Language | Unknown |
Type | text |
Rights | Copyright © nccu library on behalf of the copyright holders |
Page generated in 0.0022 seconds