Return to search

應用資料採礦技術於多個資料庫連結與整合

現今電子化的時代,有些企業雖然擁有數百萬的資料,但要分析起來是相當困難且耗時的,往往又浪費人力與金錢,而又無法得到預期的結果。而利用資料採礦技術,便可以從這大量的資料中,挖掘出隱藏的、有用的訊息及知識,還可以從既有的資料預測未來,使企業可優先獲得商機。
對於資料採礦而言,一開始的資料收集便是一項很重要的課題,資料品質的良莠,牽動著結果的正確性及預測的成敗。但每一個研究主題都有其各自的目的、所需的資料變數、適用的演算法等等,所以也有可能無法幸運地在同一個資料庫中得到所需的完整訊息,若是重新進行調查,是很費時、費力的工作。當我們面臨以上問題時,對於部份資料的缺漏該如何補救呢?!這便是我們在本研究中的研究目的。所以我們可以試著從現有的資料庫下,利用兩個其他的資料庫來輔助,利用函數映射的方法來補齊我們所要的資料,如此情況下再來做資料採礦,便能更有效率;對於我們所建立出來的預測模型,也更為準確。
在資料庫連結的過程中,我們討論了三種情況,分別為三個資料庫間有相同欄位、兩兩資料庫有相同欄位、三個資料庫間沒有相同欄位。從研究結果發現,不管資料庫之間有無相同欄位可供連結使用,利用函數映射方法為資料庫增加訊息是可行的,而且效能相當不錯,可以提供給資料採礦工作者在蒐集資料時的參考,以及未來的研究方向。

Identiferoai:union.ndltd.org:CHENGCHI/G0923540181
Creators劉致琪
Publisher國立政治大學
Source SetsNational Chengchi University Libraries
Language中文
Detected LanguageUnknown
Typetext
RightsCopyright © nccu library on behalf of the copyright holders

Page generated in 0.002 seconds