Global ETD Search

Return to search

聚類分析在迴歸模型中選擇影響資料之研究

迴歸分析是一統計工具，用來表示兩個或兩個以上變數間的關係，從一群變數可以測
某一變數所需要的資料；因此，在實際問題方面，預測工作非常重要，必須找到“好
”的模型來代表所搜集資料間隱涵的關係，使預測偏差降至最低，以減少決策的風險
。
在所搜集到的資料中常包含一些具有影響的資料，可能會對迴歸模型的配適有強烈的
影響而導致嚴重歪曲的效果，因此，須對這些具有影響的資料做謹慎地研究處理，並
決定它們是否應保留或是自資料中刪除。
在以往的文獻中，大部分皆針對計算較容易的單一影響資料的辨認，但是此研究無法
探測出具有聯合影響的資料組；因為在這個資料組中單一的資料不可能對迴歸模型的
配適影響不大，但是他們一結合起來，彼此的交互作用能產生聯合影響，進而影響迴
歸模型配適的效果。在上述的情況下，迴歸模型中影響資料組的探測是特別值得重視
的。
本文基於此種需要，期能研究“最具有”影響之資料組的選取，因此針對１９８４年
由gray與ling所提以Ｋ聚類法（Ｋ─clustering）以辨認迴歸模型具有影響之資料組
加以研究。本篇論文主要在探討以Ｋ聚類法中的一特殊情況一一單一連鎖法（SINGLE
LINKAGE METHOD ）的演算及圖形來辨認迴歸模型中具有影響資料組的候選者，然後
利用兩種影響測度量ＤI 與ＲI 評估候選者的聯合影響水準；最後，再根據聚類分析
中的停止法則（STOPPINF RULE ）Je（２）╱Je（１）選取最具有影響的資料組。

http://thesis.lib.nccu.edu.tw/cgi-bin/cdrfb3/gsweb.cgi?o=dstdcdr&i=sid=%22B2002005731%22.

Identifer	oai:union.ndltd.org:CHENGCHI/B2002005731
Creators	林貞純, LIN, ZHEN-CHUN
Publisher	國立政治大學
Source Sets	National Chengchi University Libraries
Language	中文
Detected Language	Unknown
Type	text
Rights	Copyright © nccu library on behalf of the copyright holders

Page generated in 0.0019 seconds

聚類分析在迴歸模型中選擇影響資料之研究

Description

Links & Downloads

Tags

Additional Fields