1 |
抽樣調查中關於缺失資料之各種補齊法性質之研究楊淑蘭, YANG, SHU-LAN Unknown Date (has links)
由於時代的急速變遷,人們所面臨的問題日趨複雜。在有限的人力與財力限制之下,
欲對目標母體(TARGET POPULATION ),作一詳細的調查與研究通 常是不可能的,
因此如何藉由抽樣方法從母體中抽取具有代表性的樣本是重要的。在抽樣調查的過程
中我們常常發現樣本回收率沒有原來預期的高,若我們只用回收的樣本去做資料分析
,常常使我們做成的結果是偏誤(BIASED)。本文的目的即在針對此一問題,做一深
入的研究探討。
抽樣調查中無觀測值(NONOBSERVATION)通常有三種情況發生:
(1)未包括的範圍(NONCOVERAGE ),(2)未回收(TOTAL NONRESPONSE )(3
)回答不完全(ITEM NONRESPONSE)。吾人針對回答不完全。使用插補法(IMPUTATI
O )予以研究,即是對於缺失資料的項目依據種插補法給定一些值,使回收的資料具
完整性,以利資料的分析利用。
在日常生活中經常會遇到斤欲研究變數Y 與其另一輔助變數X 有某種線性關係存在。
例如農作物產量與種植面積、家庭收入與家庭支出、1980年全市人口總數與19
70年全市人口總數等。為方便研究起見,首先假設一簡單的線性迴歸模式:
y I = β × I+εI εI ∼ i.i.d.N(O.σ□)
在上式中,若(XI,yI) i=1,2,……n 為一完整的資料集,即n 個隨機樣本(X
I,yI )皆無缺失值,則β與σ□的最小平方估計式可以很快求出,現在假設y 值有
部份缺失值,則必須想辨法把缺失的 值補齊,才能進一步研究β與σ□的性質,本
文即針對下列六種插補法。(a )平均插補法(MO)、(b )隨機插補法(RO)、(
C )分層平均
插補法(MC)、(d )分層隨機插補法(RC)、(e )簡單迴歸插補法(RG)及(f
)隨機迴歸插補法(RRS,RRN),根據所建立的模式,運用各種不同的插補法將缺失
值予以補齊後,對模式結果作理論的探討,並對各種插補法作綜合分析比較。
最後利用其理論結果,配合1986年美國零售交易普查資料作實證研究,並分析其
實結果。
|
Page generated in 0.0274 seconds