應用大數據於信用評等之模型探討 / The Application of Big Data on Credit Scoring Model

林瑀甯 Unknown Date (has links)
信用風險或信用違約意旨金融機構提供給客戶服務卻未得償還的機率,故其在銀行信貸決策的領域是常被鑽研的對象,因為其對於金融機構所扮演的角色尤其重要,對商業銀行來說更是常難以解釋或控制,然而拜現今進步的科技所賜,金融機構可以藉由操控較過去低的成本即可進一步發展強健且精煉的系統與模型去做預測還有信用風險的控管,有鑑於對客戶的評分自大數據時代來臨起,即使是學生亦開始有了可以評鑑的痕跡,憑藉前人所實驗或仰賴的基本考量面向如客戶基本資料、財力狀況或是其於該公司今昔的借貸訊息,再輔以藉由開放資料所帶來的資訊,發想可能影響信用違約率的變數如外在規範對該客戶的紀錄,想驗證是否真有尚可開發的方向,若有則其影響可以到多深。 眾所皆知從過去到現在即有很多種方法被開創以及提出以預測信用違約率,當然所使用的方法和金融機構本身的複雜性、規模大小以及信貸類型有關,最常見的有判別分析,但其對於變數有嚴格的假設,而新興的方法神經網路可以克服判別分析的缺陷且預測的效能也不錯,但神經網路只給予預測結果而運算過程是未知的,對於想要了解變數間的關係無濟於事,故還是選擇從可以對二元分類做預測亦可以藉由模型係數看到應變數和自變數間關係的羅吉斯迴歸方法著手,而研究過程即是依著前人對於羅吉斯迴歸在信用風險上的繩索摸索,將資料如何清理、變數如何轉換、模型如何建立以及最後如何篩選做一個完整的陳述,縱然長道漫漫,對於研究假設在結果終得驗證也始見曙光,考慮的新面向確有其影響力,而在模型係數上也看到其影響的大小,為了更彰顯羅吉斯迴歸對於變數間提供的訊息,故在最後將研究結果以較文字易讀的視覺化方式作呈現。 / Credit risk or credit default means the probability of non-repayment that banks or financial institutions get after they provide services to their customers. Credit risk is also studied intensively in the field of bank lending strategy because it’s usually hard to interpret and control. However, thanks to advanced technology nowadays, banks can manipulate reduced cost to develop robust and well-trained system and models so as to predict and mange credit risk. In the light of the score on customers from the beginning of big data era, every single one can be tracked to assess even though he or she is student. Relying on common facets like personal information, financial statement and past relationship of loan in a specific bank, come up with possible variables like regulations which influence credit risk according to information from open data. Try to verify if there is a new aspect of modeling and how far it effects. As everyone knows, there are several created and offered methodologies in order to predict credit default. They differ from complexity of banks and institutions, size and type of loan. One of the most popular method is discriminant analysis, but variables are restricted to its assumption. Neural network can fix the flaws of the assumption and work efficiently. Considering the unknown process of calculation in neural network, choose logistic regression as research method which can see the relationship between variables and predict the binary category. With the posterior research on credit risk, make a complete statement about how to clean data, how to transform variables and how to build or screen models. Although the procedure is complicated, the result of this study still validates original hypothesis that new aspect indeed has an impact on credit risk and the coefficient shows how deep it affects.


施佳華 Unknown Date (has links)
信用評等制度在美國已有百年以上歷史,而我國自民國80幾年開始發展評等制度,截至目前,僅有中華信用評等公司與台灣經濟新報社兩家公司提供評等服務,而台灣經濟新報社更將金融保險業排除於評等對象之外。站在穩定市場競爭、保障消費者權益、配合監理需求,以及輔助專案投標等方面來看,市場上的確需要一套能反映產險業行業特性之評等模式。 本文以美國接受A.M.Best評等之產險公司為研究對象,運用三種統計方法:多元區別分析(Multiple Discriminant Analysis,MDA)、羅吉斯迴歸(Unordered Logistic Regression,ULR)、順序性羅吉斯迴歸(Ordered Logistic Regression,OLR),來建構產險公司之信用評等模式。樣本選擇方面:估計樣本,選取美國1993年到1996年接受A.M.Best評等之產險公司327家;保留樣本,為1997年78筆資料。 而本文預定達成目標如下: 一、建立等級預測模型:參考Ederington(1985)所作債券等級預測模型,以獲利能力、槓桿、流動性、投資風險、準備金適足性五類指標共38個財務比率,透過三種統計模型,建構等級預測模型。 二、藉由等級預測之建立,尋找能有效區別產險公司評等等級之財務指標,並分析其影響程度。 三、力求模型公信力:無論變數選擇或權數決定,皆由統計軟體按照樣本特性選取產生,減少人為主觀判斷。 在決定研究對象之初,因考慮到國內產險公司接受評等之家數不多,且年數又太短,資料數量無法據以建立評等模式,因而決定以美國的產險公司為對象,再以台灣樣本作為保留樣本,預測之等級結果僅供參考之用。 / Three possible models of the P-L Insurers rating process are estimated and compared:1. Muitiple Discriminant Model, 2. Unordered Logistic Model, 3. Ordered Logistic Model. Each model is estimated for a sample of 327 American P-L insurance companies using the same 38 independent variables. The three estimated models are then employed to predict ratings for a holdout sample of 78 companies. The study analyzes 1993 through 1997 data for a sample of P-L insurers that acquired A.M.Best Financial strength ratings between December 31,1993, and December 31, 1997. Empirical evidence suggests that even when models with the same basic structure were compared, differences in estimation procedures resulted in quite different coefficient estimates and classifications. The muitiple discriminant model clearly outperformed the regression model, while the unordered logistic model was clearly superior to the ordered logistic model.

信用違約機率之預測─Robust Logitstic Regression

林公韻, Lin,Kung-yun Unknown Date (has links)
本研究所使用違約機率(Probability of Default, 以下簡稱PD)的預測方法為Robust Logistic Regression(穩健羅吉斯迴歸),本研究發展且應用這個方法是基於下列兩個觀察:1. 極端值常常出現在橫剖面資料,而且對於實證結果往往有很大地影響,因而極端值必須要被謹慎處理。2. 當使用Logit Model(羅吉斯模型)估計違約率時,卻忽略極端值。試圖不讓資料中的極端值對估計結果產生重大的影響,進而提升預測的準確性,是本研究使用Logit Model並混合Robust Regression(穩健迴歸)的目的所在,而本研究是第一篇使用Robust Logistic Regression來進行PD預測的研究。 變數的選取上,本研究使用Z-SCORE模型中的變數,此外,在考慮公司的營收品質之下,亦針對公司的應收帳款週轉率而對相關變數做了調整。 本研究使用了一些信用風險模型效力驗證的方法來比較模型預測效力的優劣,本研究的實證結果為:針對樣本內資料,使用Robust Logistic Regression對於整個模型的預測效力的確有提升的效果;當營收品質成為模型變數的考量因素後,能讓模型有較高的預測效力。最後,本研究亦提出了一些重要的未來研究建議,以供後續的研究作為參考。 / The method implemented in PD calculation in this study is “Robust Logistic Regression”. We implement this method based on two reasons: 1. In panel data, outliers usually exist and they may seriously influence the empirical results. 2. In Logistic Model, outliers are not taken into consideration. The main purpose of implementing “Robust Logistic Regression” in this study is: eliminate the effects caused by the outliers in the data and improve the predictive ability. This study is the first study to implement “Robust Logistic Regression” in PD calculation. The same variables as those in Z-SCORE model are selected in this study. Furthermore, the quality of the revenue in a company is also considered. Therefore, we adjust the related variables with the company’s accounts receivable turnover ratio. Some validation methodologies for default risk models are used in this study. The empirical results of this study show that: In accordance with the in-sample data, implementing “Robust Logistic Regression” in PD calculation indeed improves the predictive ability. Besides, using the adjusted variables can also improve the predictive ability. In the end of this study, some important suggestions are given for the subsequent studies.

從臺北市自行車安全分析探討都市街道改善策略之研究 / An Improvement Strategy of Urban Streets According to the Bicycle Safety Analysis in Taipei City

劉秉宜, Liu, Pin Yi Unknown Date (has links)
過去都市的發展與道路規劃多以汽機車為主體,對於自行車的騎乘環境相對不夠友善,而隨著近年國內自行車使用率逐年攀升,據資料指出自行車發生事故的機率也有提高的趨勢,顯示自行車於道路上之安全性考量更需重視。故本研究將針對台北市自行車肇事資料進行深入探討,找出影響肇事嚴重度之因素,進而從規劃設計面研擬降低自行車事故之改善策略。 本研究係以民國98年至102年台北市自行車事故資料為分析對象,將肇事嚴重程度分為「死亡或頭部受傷」、「人員受傷」及「未受傷」三類,同時根據文獻回顧及實務上所能取得之資料,蒐集人、路、環境等24項研究變數。首先透過統計分析了解肇事資料之特性,而後再以多項式羅吉斯迴歸模型,分別針對整體事故以及不同空間及不同事故型態之自行車肇事資料,建構自行車肇事嚴重度模型,以釐清影響自行車事故之主要因素。 研究結果顯示,道路因素中事故位置為路口及路段對於自行車事故皆有顯著影響,其中路口造成死亡或受傷之機率更高;環境因素中,因彎道或建物造成視距不良對於增加自行車事故亦有顯著影響,而坡道則會降低事故發生之機率;在人的因素中,18歲以下和年齡越大、酒駕、直行或右轉,皆會增加因自行車事故致死或受傷之機率。最後依據實證之結果,謹從交通管理中的3E政策-交通工程(Engineering)、交通教育(Education)及交通執法(Enforcement)三面向之觀念及角度帶入都市設計層面,提出道路及環境改善措施,以提升都市街道之自行車騎乘環境,並透過教育宣導、推廣活動及相關法令規範等配套措施,藉以增加自行車之騎乘安全。

以羅吉斯與類神經模型辨別台灣選擇權與期貨市場間的有效套利機會 / Distinguishing valid arbitrage opportunities in Taiwan option and future market by logistic regression and artificial neural networks

宋鴻緯, Sung, Hong Wei Unknown Date (has links)
本研究在考慮交易成本的情況下,利用羅吉斯模型、類神經模型以及其兩者的混合模型建立一分類器,用以識別台灣選擇權與期貨市場中違反買權賣權平價等式的套利訊號。由逐筆成交資料的實證結果顯示,無論在金融海嘯(2007)、景氣復甦(2008)或是平穩時期(2012~2014)時,就識別率來說三種模型相差不大,但就獲利性而言混合模型有略優於其他兩者的表現。 / Considering the transaction cost, we establish a binary classifier system by logistic regression, artificial neural networks and hybird model with aboves. The system is used for distinguishing valid arbitrage opportunities which violated put call parity in Taiwan option and future market. By tickdata, we find that, although three models has same accuracy on classification almostly, hybird model is grater then the others in profitability no matter in depression(2007), boom(2008) or business steady state(2012~2014).

面臨颱洪災害下家戶風險溝通與調適行為之研究 / A Study of Flood Disaster Risk Communication and Adaptive Behavior for Household

陳郁筠 Unknown Date (has links)
隨著氣候變遷與溫室效應影響日益明顯,台灣近年發生極端強降雨颱風的次數越來越頻繁,更造成流域地區嚴重災情,而從莫拉克風災經驗可體會到家戶風險溝通的重要性,也意識到我國實務與學術上相關研究的缺乏,故本研究探討家戶風險溝通機制中各項重要因素與調適行為間的關係,以及找出影響家戶調適行為決策之關鍵因素,進而提出家戶風險溝通策略之改善建議,以促進家戶採取調適行為。 本研究經由文獻回顧建立家戶調適行為之風險溝通概念架構,依循此架構研擬問卷,以高屏溪流域地區家戶為研究對象進行問卷調查,透過結構方程模式(SEM)驗證風險溝通架構,了解風險溝通機制各項因素與影響調適行為各因素之關係,後以面對災害回應之強烈將調適行為積極程度分為「消極或低度積極」、「中度積極」與「高度積極」,運用多項式羅吉斯迴歸模型建立家戶應變措施決策模型與調適措施決策模型,找出影響家戶調適行為決策之關鍵因素。 研究結果顯示,調適行為受到內在認知的影響,而內在認知同時受風險溝通機制與外在環境之影響,就風險溝通機制而言,親友鄰居、村里長與地方政府等社區網絡為重要管道。影響調適行為之關鍵因素以災害認知為主,其次為調適行為認知,居住村里次之,其中災害認知與調適行為認知越高,越有可能採取較積極之調適行為,此外,由於自然社會環境、風險溝通特性與社會經濟背景等因素交互影響下,各村里在調適行為決策上也有所差異。最後依據實證結果,與水患自主防災社區風險溝通現況,提出改善家戶風險溝通之策略建議,期望增進風險溝通機制的完備與促進家戶採取調適行為,以減緩極端氣候造成的衝擊。 / Along with the intensification of global climate change and greenhouse effect, typhoons with extreme rainfall strike Taiwan more and more frequently, which cause severe disasters in watershed area. From the experience of Typhoon Morakot in 2009, we realized the importance of risk communication with households and also the lack of related academic research. As a result, this study aims to discuss important factors in risk communication mechanism and their relationships with adaptive behaviors. It also find out key factors influencing decision-making of adaptive behaviors. Based on literature review, this study build a conceptual framework of risk communication process to describe how to trigger adaptive behaviors and encourage adaptive behaviors with risk communication. This study send out questionnaires to the households in Kaoping River Watershed and use structural equation modeling(SEM) to verify the conceptual framework. Then according to attitude of positive degree, adaptive behaviors are classified into“passive or low”,“medium” and “high” levels. By multinomial logistic regression, an empirical analysis was performed to analyze the key factors influencing decision-making of adaptive behaviors. The results show that adaptive behaviors are affected by internal cognition and at the same time internal cognition are affected by risk communication mechanism and external environment. As for risk communication mechanism, family, friends, neighbors and local governments are crucial communication channel. Key factors influencing decision-making of adaptive behaviors are cognition of disaster and adaptive behavior. People with higher cognition of disaster and adaptive behavior would more likely to take positive adaptive behaviors. Besides, community they lived in is also a key factor. Because the interaction of environments, risk communication patterns and socioeconomic attributes, people from different communities would take different adaptive behaviors. Based on empirical results, this study propose suggestions of risk communication strategies in order to better the risk communication mechanism and encourage households to take adaptive behaviors.


潘子杰, PAN, ZI-JIE Unknown Date (has links)
本文主要在探討非線性迴歸模式的推定問題。 首章為導論。敘述線性與非線性迴歸模式的定義及基本假設,討論最小平方推定,並 闡述非線性迴歸模式一般解的特性。 第二章為非線性迴歸模式的解法。討論最陡下降法、線性化法及Marquardt 折衷法, 並舉一實例以說明實際運算的過程。 第三章及第四章分別討論線性及非線性最小平方推定在幾何學上的意義,在樣本空間 及參數空間上探討誤差平方和等值線的特性。 第五章建立一個修正型的羅吉斯成長模式,以討論台灣地區電話需求成長的模式。 第六章為實例分析。以第二章所討論的方法,設計計算機程式,解決一電話非住宅用 戶所佔百分數的迴歸問題。 第七章為結論。對全文整體做一總結。 電子計算機程式及執行結果列於附錄中。


林秀玲 Unknown Date (has links)
在我國正式加入WTO後,汽車產業面臨嚴重競爭,且相較於其他國家,台灣的汽車市場趨近於飽和現象,在供過於求情況下,製造與裝配過程附加價值低,附加價值存在於隨品牌所提供的產品服務。藉由商業智慧系統之建立,透過資料採礦、預測的功能,將不同消費習慣的客戶進行分類,達到準確的目標行銷。   本研究採用「決策樹C5.0」、「CART迴歸樹」與「羅吉斯迴歸」等方法建立模型於新車滿意度資料庫、車主購買滿意度資料庫及車主維修滿意度資料庫之資料。從三大資料庫中找出既有顧客群裡,較有可能會再次購買同品牌汽車的顧客特性,進一步整合行銷策略,提升顧客再次購買的機會。根據不同資料庫,本研究目的如下: 一、 分析於新車滿意度資料庫之資料,此資料包含2005年購買新車之車主資料,主要是建立客戶類型區隔模型及再購模型。 二、 分析於車主購買滿意度資料庫之資料,分別建立顧客是否會再次購買以及是否會向親朋好友推薦該品牌之模型。 三、 分析於車主維修滿意度資料庫之資料,分別建立顧客是否會再次購買、是否會推薦親朋好友以及是否會再次回廠維修之模型。


李文文 Unknown Date (has links)
目前國內銀行針對無擔保消費金融業務,不再僅是重視放款量,控制申請人的信用風險、提高授信品質,更是不能等閒以對的重點。如何建構信用評分機制,降低呆帳率和授信逾放比,以減少銀行損失、增加實質獲利,已成為國內銀行共同關切與努力的課題。本研究擬藉由對無擔保消費金融商品之研究,瞭解該類借款人之信用風險,透過建置信用評分模型,做為銀行決策之參考。 國內銀行在審核無擔保消費金融貸款時,因貸款件數多,大都使用信用風險評分模型評估借款人風險。但實務上常發生借款人無JCIC資料,可評估其違約風險。目前可查到的建立信用風險模型研究中並沒有針對無JCIC資料借款人之研究。如何強化信用風險模型對於此客群之評估為本研究的目的。最後,本研究亦提出了一些重要的未來研究建議,以供後續的研究作為參考。


林芷吟, Lin Chih Yin Unknown Date (has links)
信用風險是金融機構最關切的風險之一,信用評等則是具有公信力的評等公司對企業債信良窳的客觀評估。本研究目的即在於探討在效率市場的假設前提下,股票價格所蘊含的信用風險與信用評等間之相互關係。我們以接受信用評等的上市櫃公司為研究對象,利用KMV模型求解出違約距離(Distance-to-Default, DD),再使用Kalman Filter粹取出符合公司之市場資訊(Adjusted-DD)替代股票價格,本研究分成兩部分討論,第一部份以順序羅吉斯模型(Ordered Logit Model)及羅吉斯模型(Logit Model)探討股價變動是否能領先告知未來公司信用評等的變化情形。第二部分則利用一般化自我相關條件異質變異模型(GARCH Model)觀察信用評等變動是否為市場帶來新的資訊。 第一部分實證結果發現:當長期信評調降時,電子、通訊相關產業及金融業之市場資訊(Adjusted-DD)的變動與長期信用評等為負相關,而長期信用評等調升時,仍得到負向關係,短期信用評等之部分得到當信用評等調降時,電子與通訊相關產業市場資訊變動有負向關係,與長期信用評等得到一致性之關係,但金融業則顯示市場資訊與信用評等調降為正相關,而傳統產業顯示短期信用評等調升與市場資訊呈現負向關係。 第二部分實證結果:與大多學者之研究相符,當信用評等調降時股票價格有負的異常報酬,而本研究更進一步發現當信用評等調升時,股票價格同樣隨著上漲且有顯著結果,兩者具有對稱關係。故信用評等改變時能夠為市場帶來新的資訊,可視為投資的重要參考指標之一。但以股票價格所蘊含的信用風險與信用評等間的關係卻仍無法得到應證。

