Return to search

聚類分析在迴歸模型中選擇影響資料之研究

迴歸分析是一統計工具,用來表示兩個或兩個以上變數間的關係,從一群變數可以測
某一變數所需要的資料;因此,在實際問題方面,預測工作非常重要,必須找到“好
”的模型來代表所搜集資料間隱涵的關係,使預測偏差降至最低,以減少決策的風險

在所搜集到的資料中常包含一些具有影響的資料,可能會對迴歸模型的配適有強烈的
影響而導致嚴重歪曲的效果,因此,須對這些具有影響的資料做謹慎地研究處理,並
決定它們是否應保留或是自資料中刪除。
在以往的文獻中,大部分皆針對計算較容易的單一影響資料的辨認,但是此研究無法
探測出具有聯合影響的資料組;因為在這個資料組中單一的資料不可能對迴歸模型的
配適影響不大,但是他們一結合起來,彼此的交互作用能產生聯合影響,進而影響迴
歸模型配適的效果。在上述的情況下,迴歸模型中影響資料組的探測是特別值得重視
的。
本文基於此種需要,期能研究“最具有”影響之資料組的選取,因此針對1984年
由gray與ling所提以K聚類法(K─clustering)以辨認迴歸模型具有影響之資料組
加以研究。本篇論文主要在探討以K聚類法中的一特殊情況一一單一連鎖法(SINGLE
LINKAGE METHOD )的演算及圖形來辨認迴歸模型中具有影響資料組的候選者,然後
利用兩種影響測度量DI 與RI 評估候選者的聯合影響水準;最後,再根據聚類分析
中的停止法則(STOPPINF RULE )Je(2)╱Je(1)選取最具有影響的資料組。

Identiferoai:union.ndltd.org:CHENGCHI/B2002005731
Creators林貞純, LIN, ZHEN-CHUN
Publisher國立政治大學
Source SetsNational Chengchi University Libraries
Language中文
Detected LanguageUnknown
Typetext
RightsCopyright © nccu library on behalf of the copyright holders

Page generated in 0.0019 seconds