1 |
變數遺漏值的多重插補應用於條件評估法 / Multiple imputation for missing covariates in contingent valua-tion survey費詩元, Fei, Shih Yuan Unknown Date (has links)
多數關於願付價格(WTP)之研究中,遺漏資料通常被視為完全隨機遺漏(MCAR)並刪除之。然而,研究中的某些重要變數若具有過高的遺漏比例時,則可能造成分析上的偏誤。
收入在許多條件評估(Contingent Valuation)調查中經常扮演著一個重要的角色,同時其也是受訪者最傾向於遺漏的變項之一。在這份研究中,我們將透過模擬的方式來評估多重插補法(Multiple Imputa- tion) 於插補願付價格調查中之遺漏收入之表現。我們考慮三種資料情況:刪除遺漏資料後所剩餘之完整資料、一次插補資料、以及多重插補資料,針對這三種情況,藉由三要素混合模型(Three-Component Mixture Model)所進行之分析來評估其優劣。模擬結果顯示,多重插補法之分析結果優於僅利用刪除遺漏資料所剩餘之完整資料進行分析之結果,並且隨著遺漏比例上升,其優劣更是明顯。我們也發現多重插補法之結果也比起一次插補來的更加可靠、穩定。因此如果資料遺漏機制非完全隨機遺漏之機制時,我們認為多重插補法是一個值得信任且表現不錯的處理方法。
此外,文中也透過「竹東及朴子地區心臟血管疾病長期追蹤研究」(Cardio Vascular Disease risk FACtor Two-township Study,簡稱CVDFACTS) 之資料來進行實證分析。文中示範一些評估遺漏機制的技巧,包括比較存活曲線以及邏輯斯迴歸。透過實證分析,我們發現插補前後的確造成模型分析及估計上的差異。 / Most often, studies focus on willingness to pay (WTP) simply ignore the missing values and treat them as if they were missing completely at random. It is well-known that such a practice might cause serious bias and lead to incorrect results.
Income is one of the most influential variables in CV (contingent valuation) study and is also the variable that respondents most likely fail to respond. In the present study, we evaluate the performance of multiple imputation (MI) on missing income in the analysis of WTP through a series of simulation experiments. Several approaches such as complete-case analysis, single imputation, and MI are considered and com-pared. We show that performance with MI is always better than complete-case analy-sis, especially when the missing rate gets high. We also show that MI is more stable and reliable than single imputation.
As an illustration, we use data from Cardio Vascular Disease risk FACtor Two-township Study (CVDFACTS). We demonstrate how to determine the missing mechanism through comparing the survival curves and a logistic regression model fitting. Based on the empirical study, we find that discarding cases with missing in-come can lead to something different from that with multiple imputation. If the dis-carded cases are not missing complete at random, the remaining samples will be biased. That can be a serious problem in CV research. To conclude, MI is a useful method to deal with missing value problems and it should be worthwhile to give it a try in CV studies.
|
2 |
汽車保險市場的趨勢演變 / The evolution of trends in the auto insurance market李志昌 Unknown Date (has links)
自從台灣實施費率自由化後,因為費率結構及手續費給付標準的改
變,使競爭模式也隨之不同。以汽車保險市場為例,費率自由化之後,影
響最大的不外乎是商品的費率結構。競爭市場依舊不變,但保費的折扣由
以前直接在附加費用率扣減方式,演變為條款約定及以不同危險因子來達
到減費的效果。
費率自由化在國外先進國家已行之有年,我國尚屬落後市場,產險實
施費率自由化後,市場商品的需求大同小異;主要原因為競爭市場的需求,
新商品、新條款雖因應而生,但一味的在價格上競爭,影響的層面只是保
費收入降低、服務品質低落及損失率提高。造成的結果是獲利下降,更甚
者有可能影響保險公司的經營。
國內汽車保險的行銷通路一直以來都無明顯的轉變,仍是以車商通路
為主要的業務來源。因此,過度依賴單一通路,造成了成本提高、損率惡
化及整體業務結構不良等風險。本文第二章主要探討汽車保險市場概況及
分析因整體環境的改變,對行銷通路未來的影響。對於一些無金控背景的
產物保險公司而言,行銷通路的多元化應該是一個極重要的課題。因為行
銷通路的多元化,除了能符合不同消費習慣及不同需求的消費者,增加保
費收入來源外,也是改善業務結構及降低營業成本的最佳途徑。
本文第三、四章,主要探討競爭市場中汽車保險商品的運作方式,以
及費率自由化實施後,因類似商品過度開發,造成理賠處理不當等現象。
行銷通路固然重要,但沒有符合顧客需求的保險商品,仍然無法達到預期
的效果。台灣的汽車保險商品一直停留在舊有的承保模式,商品沒有創新
的最主要原因可歸納為;顧客的需求度不高、保險公司守舊的銷售習慣及
新商品開發的積極度不足。商品缺乏創新,但是市場的競爭仍然相當激烈,
保險公司為達到顧客降低保費的需求,只能在原商品裡尋找因應模式。進
而,造成的結果就是平均保費下降、損失率提高及違反法令規定。
本文參考日本費率自由化實施後,日本汽車保險市場商品及銷售通路
的變化,及因新商品開發的浮濫,所造成理賠時保險金賠付不當或遺漏等
諸問題。藉此來檢視台灣費率自由化實施後,我國汽車保險市場的演變及
目前遭遇的案例,並研究未來的市場動向,提供經營汽車保險之建議。
關鍵字:費率自由化、行銷通路、保險金賠付遺漏
|
3 |
我國土地更正登記之研究 / The research of Taiwan's land registration of rectification高明慧 Unknown Date (has links)
更正登記之實質要件,包括「須因登記錯誤或遺漏」及「須不妨害原登記之同一性」,首先,更正登記之前提必須登記錯誤或遺漏,雖土地登記規則第13條規定登記錯誤或遺漏之定義,惟實務上或學說上之見解,似有不一致之情形;其次,通說認為更正登記必須不得妨害原登記之同一性,綜觀歷年來關於更正登記之行政訴訟案件,此為最主要的爭議問題,而要剖析此一問題之關鍵,在於釐清土地法第69條更正登記之適用範圍,是否包含土地登記規則第144條規定之塗銷登記。此外,如登記事項涉及土地法第43條公信力之保護,登記錯誤或遺漏是否必然得予更正;再者,倘受益人主張行政法上信賴保護之適用時,違法授益行政處分是否仍得予撤銷辦理更正,不無疑義。本文擬透過司法、行政實務,及學說見解,就以上更正登記之爭議問題加以探討、分析,並提出本文見解。
|
4 |
多重插補法在線上使用者評分之應用 / Managing online user-generated product reviews using multiple imputation methods李岑志, Li, Cen Jhih Unknown Date (has links)
隨著網路普及,人們越來越常在網路上購物並在線上評價商品,產生了非常大的口碑效應。不論對廠商或對消費者來說,線上商品評論都已經變得非常重要;消費者能藉由他人購買經驗判斷產品優劣,廠商能藉由消費者評價來提升產品品質,目前已有許多電子商務網站都有蒐集消費者購買產品後的意見回饋。
這些網站中有些提供消費者能對產品打一個總分並寫一段文字評論,然而每個消費者所評論的產品特徵通常各有不同,尤其是較晚購買的消費者更可能因為自己的意見已經有人提過而省略。將每個人提到的文字敘述量化為數字分數時,沒有寫到的特徵將會使量化後的資料存在許多遺漏值。
同時消費者也有可能提到一些不重要的特徵,若能找到消費者評論中,各個特徵影響消費者的多寡,廠商就能針對產品較重要的缺點改進。本研究將會著重探討消費者所提到的特徵對產品總分的影響,以及這些遺漏值填補後是否能接近消費者真實意見。
過去許多填補遺漏值的方法都是一次填補全部資料,並沒有考慮消費者會受到時間較早的評論影響。本研究設計一套多重插補的方法並透過模擬驗證,以之填補亞馬遜網站的Canon 系列 SX210、SX230、SX260等三個世代數位相機之消費者評論資料。研究結果指出此方法能夠準確估計各項特徵對產品總分的影響。 / Online user-generated product reviews have become a rich source of product quality information for both producers and customers. As a result, many E-commerce websites allow customers to rate products using scores, and some together with text comments. However, people usually comment only on the features they care about and might omit those have been mentioned by previous customers. Consequently, missing data occur when analyzing comments.
In addition, customers may comment the features which influence neither their satisfaction nor sales volume. Thus, it is important to find the significant features so that manufacturers can improve the main defects. Our research focuses on modeling customer reviews and their influence on predicting overall ratings. We aim to understand whether, by filling up missing values, the critical features can be identified and the features rating authentically reflect customer opinion.
Many previous studies fill whole the dataset, but not consider that customer reviews might be influenced by the foregoing reviews. We propose a method based on multiple imputation and fill the costumer reviews of Canon digital camera (SX210, SX230, SX260 generations) on Amazon. We design a simulation to verify the method’s effectiveness and the method get a great result on identifying the critical features.
|
5 |
應用資料採礦技術於資料庫加值中的插補方法比較 / Imputation of value-added database in data mining黃雅芳 Unknown Date (has links)
資料在企業資訊來源中扮演了極為重要的角色,特別是在現今知識與技術的世代裡。如果對於一個有意義且具有代表性資料庫中的遺漏值能夠正確的處理,那麼對於企業資訊而言,是一個大有可為的突破。
然而,有時我們或許會遇到一些不是那麼完善的資料庫,當資料庫中的資料有遺漏值時,從這樣資料庫中所獲得的結果,或許會是一些有偏差或容易令人誤解的結果。因此,本研究的目的在於插補遺漏值為資料庫加值,進而根據遺漏值類型建立插補模型。
如果遺漏值為連續型,用迴歸模型和倒傳遞類神經模型來進行插補;如果遺漏值為類別型,採用邏輯斯迴歸、倒傳遞類神經和決策樹進行插補分析。經由模擬的結果顯示,對於連續型的遺漏值,迴歸模型提供了最佳的插補估計;而類別型的遺漏值,C5.0決策樹是最佳的選擇。此外,對於資料庫中的稀少資料,當連續型的遺漏值,倒傳遞類神經模型提供了最佳的插補估計;而類別型的遺漏值,亦是C5.0決策樹是最佳的選擇。 / Data plays a vital role as source of information to the organization especially in the era of information and technology. A meaningful, qualitative and representative database if properly handled could mean a promising breakthrough to the organizations.
However, from time to time, we may encounter a not so perfect database, that is we have the situation where the data in the database is missing. With the incomplete database, the results obtained from such database may provide biased or misleading solutions. Therefore, the purpose of this research is to place its emphasis on imputing missing data of the value-added database then builds the model in accordance to the type of data.
If the missing data type is continuous, regression model and BPNN neural network is applied. If the missing data type is categorical, logistic regression, BPNN neural network and decision tree is chosen for the application. Our result has shown that for the continuous missing data, the regression model proved to deliver the best estimate. For the categorical missing data, C5.0 decision tree model is the chosen one. Besides, as regards the rare data missing in the database, our result has shown that for the continuous missing data, the BPNN neural network proved to deliver the best estimate.
For the categorical missing data, C5.0 decision tree model is the chosen one.
|
6 |
資訊遺漏與雜訊對企業盈虧預測範例學習系統衰減與干擾效果之研究陳炎欽 Unknown Date (has links)
範例學習(Learning-from-Example, LFE)技術的發展,在人工智慧發展領域中,已成功地突破關於知識萃取的瓶頸,並廣泛地應用到諸多評估或預測模式以及專家系統的建立。在本研究中,以台灣上市公司歷年來的財務報表資訊,進行企業盈虧的預測,並探討判斷個案申出現資訊遺漏與雜訊時,對範例學習系統在企業盈虧預測所產生之影響。主要的影響分別為預測績效的衰減(attenuating)與干擾(disturbing)兩類。本研究並藉由「資料預先處理轉換」及「修正系統演算法」兩方面著手,來避兔或減少上述現象發生時,對範例學習系統在企業盈虧預測績效所造成之影響。
因此本研究主要以民國七十五年到八十四年期間,共十五項大小產業之股票上市公司財務報表及股價報酬等資料作為研究樣本,整體市場共計有3199筆樣本資料。而研究的進行可分為實驗設計階段以及實証資料測試階段。
實驗設計階段中,將探討當建樹或預測之資料含有資訊遺漏與雜訊時,對企業盈虧預測範例學習系統所造成之衰減與干擾效果。在資訊遺漏之探討下,分就「資料預先處理轉換」及「修正系統演算法」兩方面,評比了「線性內插法」、「迴歸預測法」、「獨立分群法」及「多重線索分割法」等四種之遺漏值解決方案,在區別能力及預測績效上之差異性;在雜訊之探討,則了解到雜訊對範例學習系統究竟會造成多大之干擾效果,並進一步測試雜訊過濾器是否能降低部份之干擾效果。
而接下來的實証資料測試階段,則以實証資料測試上述各種模式及方法,而獲得之結果將和實驗設計階段之結果作一比較對照,以符合實務應用之狀況。而根據研究結果顯示,主要可獲得下列結論:
一、分就:1. 建樹資料含遺漏或雜訊,2. 預測資料含遺漏或雜訊,3. 建樹及預測資料同時含遺漏或雜訊,三種情況考量。則第2種情況下對範例學習系統所造成之衰減或干擾效果相對較大,第3種情況次之,第1種情況較無影響。
二、在資訊遺漏之探討下:
(一)、「迴歸預測法」及「多重線索分割法」最能避免衰減效果之發生,但前提是必需存在高度相關之替代線索。
(二)、最為簡便也最常被使用之「線性內插法」,並無法有效排除遺漏值所造成之衰減效果,而這和財務比率線索不具備單調性(Monotonicity)之原因有關。
(三)、對於遺漏值之處理若是採取整筆刪除之作法,則對系統之預測績效而言(命中率)可能造成較大之衰減效果,因為其可能破壞學習樣本資料之代表性。
(四)、在無高度相關替代線索,或者是系統之例子資料庫含有計質性(Qualitative)線索時,可以「獨立分群法」來降低遺漏值之衰減效果。
三、在雜訊之探討下:
(一)、雜訊對範例學習系統之干擾效果是存在的,因此在蒐集處理樣本資料之過程中,即應小心避免雜訊混入其中。
(二)、雜訊過濾器能否排除影響樣本代表性之極端值,就結果看來並不能獲得一致之結論;或者是對極端值取捨之界限定義應為何?則有待更進一步之研究。
|
7 |
複雜抽樣下反應變數遺漏時之迴歸分析 / Regression Analysis with Missing Value of Responses under Complex Survey許正宏, Hsu, Cheng-Hung Unknown Date (has links)
Gelman, King, 及Liu(1998)針對一連串且互相獨立的橫斷面調查提出多重設算程序,且對不同調查的參數以階層模式(hierarchical model)連結。本文為介紹複雜抽樣(分層或群集抽樣)之下,若Q個連續變數有遺漏現象時,如何結合對象之個別特性,各層或各群集的參數,以及連結各層或各群集參數的階層模式,以設算遺漏值及估計模式中之參數。
對遺漏值的處理採用單調資料擴展演算法,只需對破壞單調資料型態的遺漏值進行設算。由於考慮到不同的群集或層往往呈現不同的特性,因而以階層模式連絡各群集或各層的參數,並將Gelman, King, Liu(1998)的推導結果擴展到將個別對象之特性納入考量之上。對各群集而言,他們的共變異數矩陣Ψ及Σ為影響群內其他參數的收斂情形,由模擬獲得的結果,沒有證據顯示應懷疑收斂的問題。 / Gelman, king, and Liu (1998) use multiple imputation for a series of cross section survey, and link the parameter of different survey by hierarchical model. This text introduces a method to impute missing value and estimate the parameters affected by hierarchical model if Q continuous variables has missing value under complex survey.
For each cluster, the parameters are influenced by their variance-covariance matrix Ψ and Σ. The result obtained from the simulation have no clear evidence to doubt the convergence of parameters.
|
8 |
資料採礦中的資料純化過程之效果評估楊惠如 Unknown Date (has links)
數年來台灣金控公司已如雨後春筍般冒出來,在金控公司底下含有產險公司、銀行、證券以及人壽公司等許多金融相關公司,因此,原本各自擺放於各子公司的資料庫可以通通整合在一起,當高階主管想提出決策時可利用資料庫進行資料採礦,以獲取有用的資訊。然而資料採礦的效果再怎麼神奇,也必須先有一個好的、完整的資料庫供使用,如果資料品質太差或者資料內容與研究目標無關,這是無法達成完美的資料採礦工作。
透過抽樣調查與函數映射的方法使得資料庫得以加值,因此當有目標資料庫與輔助資料庫時,可以利用函數映射方法使資料庫整合為一個大資料庫,再將資料庫中遺失值或稀少值作插補得到增值後的資料庫。在此給予這個整個流程一個名詞 ”Data SPA(Data Systematic Purifying Analysis)”,即「資料純化」。在本研究中,主要就是針對純化完成的資料進行結構的確認,確認經過這些過程之後的資料是效用且正確的。在本研究採用了橫向評估、縱向評估與全面性評估三種方法來檢驗資料。
資料純化後的資料經過三項評估後,可以發現資料以每個變數或者每筆觀察樣本的角度去查驗資料時,資料的表現並不理想,但是,資料的整體性卻是相當不錯。雖然以橫向評估和縱向評估來看,資料純化後的資料無法與原本完整的資料完全一致,但是透過資料純化的過程,資料得以插補且欄位得以擴增,這樣使得資料的資訊量增加,所以,資料純化確實有其效果,因為資訊量的增加對於要進行資料採礦的資料庫是一大助益。 / For the past few years, Taiwan has experienced a tremendous growth in its financial industry namely in banks, life and property insurances, brokerages and security firms. Needless to say the need to store the data produced in this industry has become an important and a primary task to accomplish. Originally, firms store the data in their own database. With the progressive development of data management, the data now can be combined and stored into one large database that allows the users an easy access for data retrieval. However, if the quality of the data is questionable, then the existence of database would not provide much insightful information to the users.
To tackle the fore mentioned problem, this research uses functional mapping combining the goal and auxiliary database and then imputes the missing data or the rare data from the combined database. This whole process is called Data Systematic Purifying Analysis (Data SPA). The purpose of this research is to evaluate whether there is any improvement of the structure of the data when the data has gone through the process of systematic purifying analysis. Generally the resulting data should be within good quality and useful.
After the assessments of the data structure, the behavior of the data with respect to their added variables and observations is unsatisfactory. However the manifestation of the data as a whole has seen an improvement. The modified database through Data SPA has augmented the database making it more efficient to the usage of data mining techniques.
|
9 |
遺漏值存在時羅吉斯迴歸模式分析之研究 / Logistic Regression Analysis with Missing Value劉昌明, Liu, Chang Ming Unknown Date (has links)
無
|
Page generated in 0.0245 seconds