1 |
擴充先前知識以輔助資料發掘 / Extending Prior Knowledge for Data Mining林幸怡 Unknown Date (has links)
資料發掘研究重點在於幫助使用者於眾多現存資料中發掘出隱含於其內而先前未知的可能有用資料。目前有三大主要研究派別:(1)類神經網路(2)歸納學習方法論(3)統計方法。由於本研究之研究目的在於加入先前知識於資料發掘過程中,因此選用歸納學習方法論。歸納學習方法其內又可分為樹狀分類法,關聯分析法及概念樹導向歸納學習法,由於採概念樹導向歸納學習法所能處理的資料發掘問題種類較完整,其它二種歸納學習方法均著重於某一特定種類的資料發掘問題處理,因此,本研究針對概念樹導向歸納學習法做研究基礎,探討先前知識的種類及其運用方式,以期能增加資料發掘後的意義性。
首先從文獻中了解目前資料發掘領域的研究現況,從而由擴充先前知識的角度切入,利用企業法則、實體層次之一般化、集合化、聚集化等抽象化觀念、延伸之資料字典及經驗法則等先前知識得出更合適的資料以供資料發掘,並對於概念樹導向歸納學習法做適當的修改,提出研究架構。再以假想的學校資料庫,發展出一套雛形系統,驗証本架構的可行性。最後提出進一步的研究建議,以供後續研究參考。 / The research objective of data mining is to help users find previous unknown and maybe usable information from database. There are three ways to do this:(l)neutral network (2)inductive learning (3)statistics. Inductive Learning has three different ways: learning by decision trees, association rules and using concept trees.
Because concept trees approach to inductive learning can solve more kinds of problem, the other two ways just can solve one kind of problem, we choose using concept trees to be our foundation of this research. At the same time, we explore and discuss serveral kinds of prior knowledge and their applications. We hope that it can increase the semantics of mining results.
This thesis, first surveys previous research in data mining and discuss the prior knowledge that they included. Then, we propose our idea of extending and using prior knowledge including data abstractions (generalization, association and aggregation) in the extended entity-relationship model, bussiness rule, extended data dictionary and heuristics, in order to assist the process of data mining. A prototype is reported to prove our research architecture. Finally, some sugestion are given to future research.
|
2 |
網頁資料發掘技術導入網站經營者之研究-以入口網站之分類索引服務為例林繼文 Unknown Date (has links)
網頁資料發掘為從全球資訊網所發現或分析而得的有用資訊。若能在訪客所留下的紀錄中,分析出這些資訊,對於經營者而言是一個重要的決策依據。入口網站幾乎僅以廣告為主要收入,如何借重網頁資料發掘技術來了解網路使用者的行為,作為加強網站內容設計與經營方向的參考,當為目前經營者所關心的重要課題。本研究將導入知識的觀點,利用商業智慧中的資料發掘技術,實際分析網站的紀錄資料,研究網頁資料發掘技術對於網站經營者的幫助,進而為企業組織帶來競爭優勢。
網站的日誌檔看似平凡無奇,然而如何從中獲取企業的求勝關鍵,相信是所有希望仰賴資訊科技的網站經營者所關切的。本研究歸納整理網站營運相關的流量指標分析、資源使用分析,與使用者活動分析,並經由實際分析網站經營者一個月內的日誌資料,歸納出流量之變化週期、流量指標之替代性、不同類別的熱門程度、網頁與停留時間的關係、分類索引服務使用者之特性等發現,進而提出對網站經營者的建議,提供企業及後續學術研究的參考。
|
3 |
企業網路下之資料發掘 / Data Mining in the Intranet Enviroment金士俊, Chin, Shi-Chun Unknown Date (has links)
近幾年來,企業網路在各大小企業中蓬勃發展,因此而產生在企業網路上尋找資訊的問題。對於許多掌握其企業網路的複雜程度尚存在困難的企業來說,要從其企業網路上大量的文件中找出真正有用的、潛在的資訊與知識,誠非易事。因此有待以較深入的思考構面對於各企業的企業網路架構進行檢視,才能找出適當的資料發掘做法與技術,以解決此一難題。本研究先對資料發掘,企業網路等文獻與現況進行整理分析,並提出與企業網路複雜程度相關之參考思考構面並定義簡單型與複雜型的企業網路。然後以Han(1995)之概念樹及多層次資料庫的觀念,採用我們對於網際網路資料發掘所提出的理論架構與作法(楊亨利與金士俊,民90),特別著重企業在授權與知識視野上的思考,提出簡單型與複雜型企業網路下對資料內容發掘的架構,設計適用於簡單型與雜型企業網路之資料發掘系統,並部份實作其雛形,以驗証其可行性,並評估其日後實務操作之其他可能。 / In recent years, with the widespread use of the Intranet, Intranet data searching has become an important but problematic issue. Since a lot of enterprises still have difficulty in evaluating the complexity of their Intranet systems, it is an extremely demanding task for them to identify valid and potentially useful patterns from the huge amount of documents in the Intranet. In order to solve this problem, it is essential to take a close and careful examination of the different Intranet frameworks, so that appropriate data mining approaches and techniques can be worked out.
This research began with a literature review of the fields of data mining and Intranet applications in Taiwan. Based on the review of current theories and practices, the second part of the research focused on the dimensions which we need to consider for evaluating the complexity of Intranet systems. In the third part of the research, basic frameworks for simple and complex Intranet data mining systems were then proposed, three types of data mining approaches suitable for simple and complex Intranet systems were designed and a prototype for implementing two approaches were developed. Han’s (1995) “concept hierarchy” and “multiple layered database” and Yang & Chin’s (2000) approach of Internet data mining were adopted as the major bases. Besides, this research also paid particular attention to the issues of “authorization” and “knowledge view” when designing the software and developing the prototypes. In the last part of the research, the feasibility, practicality and potential uses of the ata mining approaches and prototype were discussed and some directions for future research were suggested.
|
4 |
健保醫療費用審查自動化之研究 / The Research of Automatic Peer Review in National Health Insurance王復中, Wang, Fu-Chung Unknown Date (has links)
全民健康保險自實施以來,透過危險分擔與社會互助的原則,降低了民眾就醫時的財務障礙,進而促進了全體國民的健康。可是由於收入成長減緩與支出不斷增加的情形,使得這個制度目前已面臨嚴重的財務危機,然而在目前政治與經濟環境的雙重影響之下,健保收入已無法有效增加,因此努力控制醫療費用支出,便成為當務之急。但是全民健康保險是一項社會福利政策,不能因為控制醫療費用而降低了醫療品質。如何將醫療資源有效分配,以便減少醫療資源浪費、維持醫療品質並減輕醫療費用的支出,便需依賴一個良好的審查制度。
然而對於醫療費用的審查,不管在設計、分析、控管乃至評估上,都是知識密集的工作,而且審查的過程還必須藉由專業審查者的參與始能完成,因此如何善用資訊科技予以適當之輔助,便成為醫務管理上一個非常重要的議題。
本研究使用健保局北區分局感冒等疾病之就醫資料作為樣本,在分析過國內外對醫療費用審查的建議方式後,嘗試設計一個新的自動化審查機制,並發展一套以資料發掘為基礎的自動化審查雛型系統,希望能在醫療院所申報的記錄中找出共同的規則,並利用這些規則自動將有問題的資料篩選出來,幫助健保局與專業審查者將焦點集中在有問題的資料上,以便能更有效率的進行審查的工作。
本研究所得到的結果,經健保局人員與專業審查醫師檢視後,認為確實可行,除了證明資料發掘技術可以有效地應用在醫療費用審查,並帶來可觀的效益之外,還達到有效降低審查人力、提昇審查效率的目的。而對於這種自動篩選出異常的審查方式,應如何實際加以應用,本研究也提出了具體的建議架構及實施步驟,供健保局在未來建立自動化審查制度時的參考依據。
|
5 |
如何在資料庫中發掘空間性週期關聯規則--以便利商店交易資料為例 / Data Mining of Spatial Cyclic Association Rules in Databases -- A Convenience Store Transaction Data Example郭家佑, Guo, Jia-You Unknown Date (has links)
資料發掘目前在傳統關聯式資料庫相關議題上已有不少研究,但如果能再整合空間和時間要素進來,將可從資料中發掘出更明確、更具體的知識。以往常使用統計分析方法來分析空間資料,不幸的是,統計分析方法仍有許多問題亟待解決。而Han等人利用概念樹發掘「多層次關聯規則」的技術已相當成熟,值得學習。在時間方面,另外有學者提出「週期關聯規則」的觀念。於是本研究便想結合以上研究的優點,希望能創造出新的應用。
本研究試著將「空間特性」和「週期關聯規則」結合,提出「空間性週期關聯規則」的想法。首先從相關文獻中分別瞭解目前空間、時間資料發掘領域的研究現況,從而整合相關研究,提出研究架構。再以動態網頁技術配合假想的台北市便利商店交易資料庫,發展出一套雛型系統(目前只能作單一項目之間的關聯),以驗證本架構的可行性。最後提出進一步的研究建議,以供後續研究參考。 / There have been a lot of research about data mining in relational database. We can mine more specific and concrete knowledge in transaction databases by further considering spatial and temporal dimension. Until now the statistical spatial analysis has been one common technique for analyzing spatial data. However , there are still many remaining problems. Han et al. used concept hierarchies to mine multiple-level association rules. Their ideas are great and worth our learning. On the other hand , some scholars proposed the notion of cyclic association rules. Therefore , we combine the merits of these researches to discover more meaningful knowledge.
In this research , we try to integrate the ideas of spatial associations with cyclic association and propose the idea of spatial cyclic association rules. First , we survey these researches in the fields of spatial and temporal data mining. A framework is then proposed. Finally , we implement a prototype system in WWW ( 1-itemset and 2-itemset only now).
|
6 |
以資料發掘技術分析政大通識課程 / Using data mining to analyze general courses of national cheng - Chi University樓玉玲, Lo, Yu-Lin Unknown Date (has links)
資料發掘研究重點在於幫助使用者從眾多現存資料中發掘出隱藏於其內前所未知且可能非常有用的資訊。本研究應用資料發掘技術於通識課程規劃上,經由文獻探討建立初步的研究架構,採用政大學生選修通識課程之資料進行資料發掘,最後分析結果可作為未來政大通識課程規劃之參考。
傳統規劃通識課程的方式多是以老師為出發點,這樣的規劃方式難免有欠考量之處,而學生選課必須依據老師所開的課程,未必能選修到自已真正有興趣的通識課程。本研究以學生需求觀點為出發點,將學生選修通識課程行為對應到顧客購物行為觀念上,再應用資料發掘技術來分析政大通識課程,建立學生─顧客、課程─商品及老師─商品品牌的對應分析模式,透過資料發掘技術的分析方法,找出學生選擇通識課程的特性與關鍵,可以提供通識課程規劃另一個方向的思考,使得通識課程的規劃更加更切合學生需求。
|
Page generated in 0.0231 seconds