• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 25
  • 20
  • 5
  • Tagged with
  • 25
  • 25
  • 13
  • 13
  • 11
  • 9
  • 9
  • 8
  • 7
  • 7
  • 7
  • 6
  • 5
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.


李淑銘 Unknown Date (has links)


陳柏宇 Unknown Date (has links)
近年來電腦科技進步、資料庫健全發展,使得處理大量資料的需求增加,因而發展出結合生物醫學與資訊統計兩大領域的生物資訊(Bio-informative)。這個新學門的特色在於資料量及資料變數的龐雜,但過多資料經常干擾資訊的篩選,甚至癱瘓資料分析,因此如何適當地縮減資料(Data Reduction)就變得必要。資料縮減常藉由維度縮減(Dimension Reduction)進行,其中常見的線性維度縮減方法首推主成份分析,屬於非監督式學習(Unsupervised Learning)的一種,而線性的監督式學習(Supervised Learning)方法則有SIR(Sliced Inverse Regression)、SAVE(Sliced Average Variance Estimate)及pHd(Principal Hessian Directions)。非監督式學習的主成份分析,主要在找出少數幾個維度而可以解釋代表自變數的變異程度,而監督式學習的SIR、SAVE及pHd則可以在縮減維度時,同時考量自變數跟應變數之間的關係,而找出可以解釋應變數的維度。 本研究為解決蛋白質質譜儀資料高維度的問題,將應用各種線性維度縮減方法,並分別使用CART(Classification and Regression Tree)、KNN(K-Nearest Neighbor)、SVM(Support Vector Machine)、ANN(Artificial Neural Network)四種分類器,比較各維度縮減方法的分錯率高低,以交叉驗證(Cross Validation)比較維度縮減方法的優劣。研究發現在四種維度縮減方法中,PCA及SIR在各種分類器下都有較為穩定的分錯率,表現較為一致,但SAVE及pHd較不理想。我們也發現在不同的分類器下,PCA跟SIR兩者有不同表現,正確率較高的分類器(SVM與ANN)與PCA結合,而正確率較低的分類器(CART與KNN)與SIR結合,會有較佳的結果。另外,我們也嘗試整合分析(Meta Analysis),綜合幾種線性維度縮減方法,而提出邊際訓練效果法(Marginal Training Effect Method)與加權整合法(Meta Weighted Method),其中發現邊際訓練效果法若可以挑選出有效的維度,可以在不同分類器下提高整體模型,而加權整合法則確保在不同分類器下,讓其分類模型具有較為穩定的準確率;並提出相關係數重疊法(Overlap Correlation Method)來解決需要決定維度大小的問題。

基於資訊理論熵之特徵選取 / Entropy based feature selection

許立農 Unknown Date (has links)
特徵選取為機器學習常見的資料前處理的方法,現今已有許多不同的特徵選取演算法,然而並不存在一個在所有資料上都優於其他方法的演算法,且由於現今的資料種類繁多,所以研發新的方法能夠帶來更多有關資料的資訊並且根據資料的特性採用不同的變數選取演算法是較好的做法。 本研究使用資訊理論entropy的概念依照變數之間資料雲幾何樹的分群結果定義變數之間的相關性,且依此選取資料的特徵,並與同樣使用entropy概念的FCBF方法、Lasso、F-score、隨機森林、基因演算法互相比較,本研究使用階層式分群法與多數決投票法套用在真實的資料上判斷預測率。結果顯示,本研究使用的entropy方法在各個不同的資料集上有較穩定的預測率提升表現,同時資料縮減的維度也相對穩定。 / Feature selection is a common preprocessing technique in machine learning. Although a large pool of feature selection techniques has existed, there is no such a dominant method in all datasets. Because of the complexity of various data formats, establishing a new method can bring more insight into data, and applying proper techniques to analyzing data would be the best choice. In this study, we used the concept of entropy from information theory to build a similarity matrix between features. Additionally, we constructed a DCG-tree to separate variables into clusters. Each core cluster consists of rather uniform variables, which share similar covariate information. With the core clusters, we reduced the dimension of a high-dimensional dataset. We assessed our method by comparing it with FCBF, Lasso, F-score, random forest and genetic algorithm. The performances of prediction were demonstrated through real-world datasets using hierarchical clustering with voting algorithm as the classifier. The results showed that our entropy method has more stable prediction performances and reduces sufficient dimensions of the datasets simultaneously.

以二維度馬可夫鏈的排隊模型研究客戶服務中心之等候機制 / A queueing model of call center by two-dimensional Markov chain approach in a case study

黃瀚陞 Unknown Date (has links)
在這篇論文中,藉由一個二維度的馬可夫鏈, 建立保護VIP線路同時允許重試現象的一般客戶線路的數學模型。 我們提出一個融合階段演算法以處理此二維度的馬可夫鏈,並且提出管理成本函數以研究在客服中心中最適當的服務人員數目 。藉由逼近法,找出一般顧客在重試群裡的平均等候時間和等候時間機率分配函數的上界與下界。 數值結果說明逼近方法對於計算一個很大的系統時可以省下很多計算時間,而且不失準確性。 最後,我們探討逼近法和實際解之間的誤差,數值結果也說明隨著系統容量或顧客到達率的增加,逼近法將更為準確。 / In this thesis, we model a call center with guard channel scheme for VIP calls and retrial phenomenon for regular calls by a 2-dimensional Markov chain. We present a phase merging algorithm to solve the 2-dimensional Markov chain and a managerial cost function corresponding to studying the optimum number of servers in a call center. Also we will obtain upper and lower bounds with probability distribution functions of waiting time by using approximation. Numerical results show the approximation can save computational time without losing precision in the case of a call center with large capacity. Moreover, errors of the approximation are discussed, and it shows that the approximation is more accurate when the capacity of system or the arrival rate is large.

針對社群媒體上的趨勢變化之視覺化探索工具 / A study of visual exploration tool for comparing trend

郭建凱, Kuo, Jian-Kai Unknown Date (has links)
隨著社群媒體的普及,新聞媒體與意見領袖逐漸重視在社群媒體上以貼文方式發佈新聞資訊,社群媒體成為許多使用者會接收新聞與重大事件的主要管道且透過社群媒體的評論、分享與按讚等互動機制表達立場,這些即時互動行為是傳統媒體缺乏的機制,如何分析也是研究上的挑戰。本研究將針對Facebook上的貼文與互動行為進行分析,提供一款互動視覺化系統,找出貼文資料集中相似的貼文群集以及隨著時間推移下貼文屬性的變化,進一步瞭解Facebook上使用者、貼文與重大事件之間的相互影響。由於Facebook上的貼文與互動行為具多維度屬性,我們透過降維演算法將大量的貼文以二維散佈圖呈現,達到將相似貼文分群的效果。另外,我們設計了一種視覺化呈現方法,「Time Block」,突顯出時間的推移下貼文屬性的變化,藉此觀察出貼文資料集是否存在特定的模式。最後提供即時互動的操作介面,以及貼文屬性以及關鍵字兩者的統計,藉此連接到貼文集的屬性與時間的分佈關係,協助以視覺化方式進行探索與分析。最後,透過案例分析與使用者測試呈現此視覺化探索工具的優缺點。 / Social media becomes an essential medium for broadcast news. News media and option leader post information and people love to receive news and interactive using comment and likes to feedback. It is a research challenge to analysis this massive amount interactive behavior data in social media. In this paper, we propose an interactive visualization system to explore on the posts and interactions on Facebook. This system can help a user to find out the similar interactive behavior cluster and the trend of time-varying attributes to understand how the users, posts, and a big event to affect each other. Facebook Posts and interactive behavior contains multiple dimensional attributes; we adopt the dimensional reduce algorithm and 2D scatter plot to present the cluster in the spatial domain. Then, we design a time-varying visualization method, `Time Block,' can highlight the changing attributes and observe the unique pattern in the time domain. Also, we design a real-time interactive interface to connect the cluster and trend visualization with additional keyword distribution and attribute statistics. Finally, we use case study and user study to demonstrate the advantage of the proposed system.


甘貴華, GAN,GUI-HUA Unknown Date (has links)
縮減資料維度一直是多變量資料分析的主要技術, 運用投影追蹤法(Projection Purs -uit) 將高維度多變量資料投影至低維度空間, 亦是一種縮減維度的方法, 將更有助 於了解資料結構特性。 投影追蹤法最重要的部份是投影指數(Projection Index)的定義, 投影指數指出了使 用者的興趣與意圖, 并針對不同問題定義不同的投影指數, 也因此許多多變量分析技 術亦可視為投影追蹤法的特例, 例如: 將投影指數定義為投影后資料的變異數, 則推 導出主成分分析; 定義為一分類規則的錯誤率, 則可推導出線性判別分析……等等。 在探測性資料分析方面, 亦可定義出適當的投影指數以戡察資料的叢聚及非線性結構 等特性。定義投影指數之后, 則必須選取適當的數值分析方法(Numerical Method), 并輔以電腦功能來施行。除了縮減資料維度外, 投影追蹤法亦已於無毋數回歸分析(N -onparametric Regression Analysis)及密度估計(Density Estimation)的應用上大 有斬獲。 到目前為止, 投影追蹤法在多變量資料分析上, 仍為一新發展的技術, 在國內尚未見 有關此一研究範疇的報告及著作, 本文將就投影追蹤法這項新技術的起源、發展、沿 革、理論與應用做一廣泛而密集的探討。

企業建立平衡計分卡之研究 / Research of Balanced ScoreCard Using Case Study

王清弘, Wang, Ching-Hung Unknown Date (has links)
在科技發達的現今,而企業間的經營競爭也愈來愈激烈,企業需要有一套績效評估的標準以知道本身是否有成長?是否有利潤產生?是否具有競爭力?然而在現今的資訊時代中,大部分的企業所採用的企業績效評估的標準仍以傳統的財務會計模式為主,然而財務面只是企業經營成果的最後衡量,而哪些因素是影響、導致最後在財務面的成果展現則是非常重要且需要去探討的。 Kaplan & Norton所提出的平衡計分卡(The Balanced Scorecard; BSC)能幫助企業達成願景,滿足股東的期望。平衡計分卡(BSC)包括四個構面(財務、顧客、內部流程、學習與成長),強調企業最後的營運績效(利潤)不僅只來自於財務報表的資料成果,還包括其它層面(如顧客、內部流程、學習與成長)所間接產生的因果關係所造成的影響。 另一方面,企業的資訊系統(IS)可以產生有用的資訊以提供給高階主管決策之用,幫助調整企業的策略目標與願景,可反應出企業策略的制定有無妥善。然而,傳統的資訊系統(IS)卻無法即時有效地提供資訊;因此,就應利用多維度模式(Multi-Dimensional Model)的資料結構來找出所追求的關鍵性資訊以供作決策。 在資訊時代中,對於如何幫助企業發展一個平衡計分卡(BSC),使企業根據策略目標與願景獲取競爭優勢以達到永續經營;而以多維度模型(Multi-Dimensional Model)所建構的資訊系統,可反應出經過分析後所得到的資訊是否可以支援(Support)企業在平衡計分卡(BSC)中所設計的策略性指標(Indicators)。 根據以上所述,本研究針對製造業中的一家製帽公司進行研究,探討企業是否能夠建立平衡計分卡(BSC)系統?同時,探討企業的資訊系統(IS)對於平衡計分卡(BSC)的支援情況如何?以及從一般的資訊系統建立平衡計分卡(BSC)的困難處在哪?最後,要探討的是如何利用資料結構(多維度模型)去支援(Support)平衡計分卡(BSC)? 研究所得結論可歸納為,受訪的個案公司能夠接受平衡計分卡(BSC)的觀念;然而平衡計分卡(BSC)的實施有賴於各層面因果關係的建立;若要達到各層面因果關係的建立,則企業需要有以流程為主的整合資訊系統;而受訪個案公司的傳統資訊系統不易支援平衡計分卡(BSC);若企業沒有良好的資料模型就無法支援平衡計分卡(BSC);而平衡計分卡(BSC)需要以多維度模型(Multi-Dimensional Model)來支援。


方悟原, Fang, Wu-Yuan Unknown Date (has links)
本文以維度縮減(dimension reduction)為主題,介紹其定義以及四種目前較被廣為討論的處理方式。文中首先針對Li (1991)所使用的維度縮減定義型式y = g(x,ε) = g1(βx,ε),與Cook (1994)所採用的定義型式「條件密度函數f(y | x)=f(y |βx)」作探討,並就Cook (1994)對最小維度縮減子空間的相關討論作介紹。此外文中也試圖提出另一種適用於pHd的可能定義(E(y | x)=E(y |βx),亦即縮減前後y的條件期望值不變),並發現在此一新定義下所衍生而成的子空間會包含於Cook (1994)所定義的子空間。 有關現有四種維度縮減方法(SIR、SAVE、SIR-II、pHd)的理論架構,則重新予以說明並作必要的補充證明,並以兩個機率模式(y = bx +ε及y = |z| +ε)為例,分別測試四種方法能否縮減出正確的方向。文中同時也分別找出對應於這四種方法的等價條件,並利用這些等價條件相互比較,得到彼此間的關係。我們發現當解釋變數x為多維常態情形下,四種方法理論上都不會保留可以被縮減的方向,而該保留住的方向卻不一定能夠被保留住,但是使用SAVE所可以保留住的方向會比單獨使用其他三者之一來的多(或至少一樣多),而如果SIR與SIR-II同時使用則恰好等同於使用SAVE。另外使用pHd似乎時並不需要「E(y│x)二次可微分」這個先決條件。 / The focus of the study is on the dimension reduction and the over-view of the four methods frequently cited in the literature, i.e. SIR, SAVE, SIR-II, and pHd. The definitions of dimension reduction proposed by Li (1991)(y = g( x,ε) = g1(βx,ε)), and by Cook (1994)(f(y | x)=f(y|βx)) are briefly reviewed. Issues on minimum dimension reduction subspace (Cook (1994)) are also discussed. In addition, we propose a possible definition (E(y | x)=E(y |βx)), i.e. the conditional expectation of y remains the same both in the original subspace and the reduced subspace), which seems more appropriate when pHd is concerned. We also found that the subspace induced by this definition would be contained in the subspace generated based on Cook (1994). We then take a closer look at basic ideas behind the four methods, and supplement some more explanations and proofs, if necessary. Equivalent conditions related to the four methods that can be used to locate "right" directions are presented. Two models (y = bx +ε and y = |z| +ε) are used to demonstrate the methods and to see how good they can be. In order to further understand the possible relationships among the four methods, some comparisons are made. We learn that when x is normally distributed, directions that are redundant will not be preserved by any of the four methods. Directions that contribute significantly, however, may be mistakenly removed. Overall, SAVE has the best performance in terms of saving the "right" directions, and applying SIR along with SIR-II performs just as well. We also found that the prerequisite, 「E(y | x) is twice differentiable」, does not seem to be necessary when pHd is applied.

台灣股票市場分類股價指數-碎形與混沌之探討 / The Index of Stock market in Taiwan - Fractals and Chaos

李世欽, Lee, Shih Chin Unknown Date (has links)
本研究資料取自教育部EPS資料庫,研究期間為民國76年一月到84年一月之分類股價指數,共二千二百九十四筆資料。結果發現台灣證券交易所之分類股價指每日報酬率的行為,顯著拒絕iid之虛無假設,顯示台灣股票市埸有強烈的非線性現象,拒絕原因不是來自不穩定性、也非市場為一混沌系統。本研究利用自我相關函數圖形觀察分類股價指數每日收盤價,發現每筆資料皆呈現緩慢下降的情形,因此將資料取自然對數及一階差分作資料轉換,將符合穩定性的要求。實驗結果可歸納出以下的結論:(1)國內分類股價指數每日報酬率配適AR(3)模型,利用Ljung-Box Q統計量檢定除了金融、食品及加權三筆資料不甚理想外,其它資料均可除去自我相關性。(2)以BDS統計量的結果顯示,股價報酬率均拒絕iid的假設,亦即市埸報酬不具有隨機的形態,其中以水泥類最為強烈。(3)雖然原始資與經亂數編排後的相關維度,已有所不同,但所有原始資料的相關維度均不呈現收斂的現象,顯示市場不具有碎形結構。(4)close returns檢定方法檢定結果顯示,股票市埸不具有混沌現象。

充分維度縮減於整體性檢定之應用 / Application of sufficient dimension reduction to global test

徐碩亨, Hsu, Shuo Heng Unknown Date (has links)

Page generated in 0.0207 seconds