1 |
資訊遺漏與雜訊對企業盈虧預測範例學習系統衰減與干擾效果之研究陳炎欽 Unknown Date (has links)
範例學習(Learning-from-Example, LFE)技術的發展,在人工智慧發展領域中,已成功地突破關於知識萃取的瓶頸,並廣泛地應用到諸多評估或預測模式以及專家系統的建立。在本研究中,以台灣上市公司歷年來的財務報表資訊,進行企業盈虧的預測,並探討判斷個案申出現資訊遺漏與雜訊時,對範例學習系統在企業盈虧預測所產生之影響。主要的影響分別為預測績效的衰減(attenuating)與干擾(disturbing)兩類。本研究並藉由「資料預先處理轉換」及「修正系統演算法」兩方面著手,來避兔或減少上述現象發生時,對範例學習系統在企業盈虧預測績效所造成之影響。
因此本研究主要以民國七十五年到八十四年期間,共十五項大小產業之股票上市公司財務報表及股價報酬等資料作為研究樣本,整體市場共計有3199筆樣本資料。而研究的進行可分為實驗設計階段以及實証資料測試階段。
實驗設計階段中,將探討當建樹或預測之資料含有資訊遺漏與雜訊時,對企業盈虧預測範例學習系統所造成之衰減與干擾效果。在資訊遺漏之探討下,分就「資料預先處理轉換」及「修正系統演算法」兩方面,評比了「線性內插法」、「迴歸預測法」、「獨立分群法」及「多重線索分割法」等四種之遺漏值解決方案,在區別能力及預測績效上之差異性;在雜訊之探討,則了解到雜訊對範例學習系統究竟會造成多大之干擾效果,並進一步測試雜訊過濾器是否能降低部份之干擾效果。
而接下來的實証資料測試階段,則以實証資料測試上述各種模式及方法,而獲得之結果將和實驗設計階段之結果作一比較對照,以符合實務應用之狀況。而根據研究結果顯示,主要可獲得下列結論:
一、分就:1. 建樹資料含遺漏或雜訊,2. 預測資料含遺漏或雜訊,3. 建樹及預測資料同時含遺漏或雜訊,三種情況考量。則第2種情況下對範例學習系統所造成之衰減或干擾效果相對較大,第3種情況次之,第1種情況較無影響。
二、在資訊遺漏之探討下:
(一)、「迴歸預測法」及「多重線索分割法」最能避免衰減效果之發生,但前提是必需存在高度相關之替代線索。
(二)、最為簡便也最常被使用之「線性內插法」,並無法有效排除遺漏值所造成之衰減效果,而這和財務比率線索不具備單調性(Monotonicity)之原因有關。
(三)、對於遺漏值之處理若是採取整筆刪除之作法,則對系統之預測績效而言(命中率)可能造成較大之衰減效果,因為其可能破壞學習樣本資料之代表性。
(四)、在無高度相關替代線索,或者是系統之例子資料庫含有計質性(Qualitative)線索時,可以「獨立分群法」來降低遺漏值之衰減效果。
三、在雜訊之探討下:
(一)、雜訊對範例學習系統之干擾效果是存在的,因此在蒐集處理樣本資料之過程中,即應小心避免雜訊混入其中。
(二)、雜訊過濾器能否排除影響樣本代表性之極端值,就結果看來並不能獲得一致之結論;或者是對極端值取捨之界限定義應為何?則有待更進一步之研究。
|
Page generated in 0.0285 seconds