spss缺失值填補方法 spss數據中缺失值處理方法?
spss數據中缺失值處理方法?缺失值處理就是簡單的兩種處理,一種是刪除缺失,另一種是填充缺失當缺失值只占總樣本量的很小比例時,各種處理方法都可以使用,差別不大最簡單的就是找到三個缺失數據,并刪除缺失的
spss數據中缺失值處理方法?
缺失值處理就是簡單的兩種處理,一種是刪除缺失,另一種是填充缺失
當缺失值只占總樣本量的很小比例時,各種處理方法都可以使用,差別不大
最簡單的就是找到三個缺失數據,并刪除缺失的案例,即不使用主題。
第二種方法是多用人,均值填充法,在SPSS菜單中選擇:Transform replace missing value,The missing variables into The right analysis box,默認方法是均值填充法,OK
第三種方法比均值填充法好一點,在SPSS菜單中選擇:分析-缺失值分析,將缺失變量放入右邊的框中,注意類別變量和數量變量之間的差異。在估計方法中,給出了四種方法。前兩種是刪除法,后兩種是填充法。推薦的最佳方法是em。選中em復選框后,底部的em按鈕將從灰色變為黑色。單擊此按鈕,選中保存完成的數據復選框,然后命名新數據。確定后,SPSS會生成一個新的數據集,數據集中的數據是填寫的缺失值
如果缺失值只占數據的5%以下,那么缺失值對數據的影響很小,各種缺失處理方法也沒有什么區別。最好是簡單處理,比如填寫均值,或者直接刪除缺失的案例,但是均值填寫不能利用缺失數據中可能包含的有效信息,刪除案例可能會導致數據結構效益影響的不確定性(例如,在績效考核中,不合格者沒有成績,形成缺憾,刪除缺憾會使數據缺乏代表性,只有合格者,沒有不合格者)。與均值插補法相比,回歸插補法更準確(僅限于缺失值不多的情況,否則回歸會產生偏估計)。如果存在大量缺失值,建議使用EM算法。通過模擬研究,許多研究者表明,這種插補方法可以得到最準確的結果。其操作是在SPSS菜單中選擇“分析缺失值分析”,彈出對話框,在右邊的變量框中選擇要填充的缺失數據(注意變量類型),在估算方法中選擇em,然后單擊em,將填充的數據保存為新的數據集