SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場(chǎng)、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 在使用IBM SPSS Statistics參數(shù)檢驗(yàn)中的T檢驗(yàn)時(shí),一般情況下,都需先驗(yàn)證數(shù)據(jù)是否服從正態(tài)分布。如果服從正態(tài)分布的話,就可以執(zhí)行T檢驗(yàn);反之,則需要使用非參數(shù)檢驗(yàn)的方法。
那么,該如何使用SPSS檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布呢?我們可以使用非參數(shù)檢驗(yàn)中的KS檢驗(yàn)、圖表中的Q-Q圖、描述統(tǒng)計(jì)中的偏度峰度系數(shù)、探索統(tǒng)計(jì)的正態(tài)驗(yàn)證來進(jìn)行數(shù)據(jù)的正態(tài)分布檢驗(yàn)。本文會(huì)先重點(diǎn)介紹KS檢驗(yàn)與Q-Q圖。
一、KS檢驗(yàn)
KS檢驗(yàn),是Kolmogorov-Smirnov檢驗(yàn)的簡(jiǎn)稱,中文譯為柯爾莫哥洛夫-斯米爾諾夫檢驗(yàn),是一種檢驗(yàn)擬合優(yōu)度的檢驗(yàn)方法,可用于檢驗(yàn)數(shù)據(jù)是否服從理論分布,比如是否服從正態(tài)分布。
接下來,我們使用一組初中生的身高數(shù)據(jù)來作為示例數(shù)據(jù)。

圖1:示例數(shù)據(jù)
然后,如圖2所示,在SPSS的非參數(shù)檢驗(yàn)菜單中,打開單樣本KS檢驗(yàn)功能。

圖2:KS檢驗(yàn)功能
如圖3所示,在KS檢驗(yàn)設(shè)置面板中,重點(diǎn)是要進(jìn)行檢驗(yàn)變量與檢驗(yàn)分布的設(shè)置。本例需要檢驗(yàn)的是身高樣本數(shù)據(jù)是否服從正態(tài)分布,因此,需要將身高變量添加到檢驗(yàn)變量,并勾選檢驗(yàn)分布中的“正態(tài)”選項(xiàng)。
在正態(tài)檢驗(yàn)選項(xiàng)中,一般情況下,選擇默認(rèn)的“使用樣本數(shù)據(jù)”即可。

圖3:KS檢驗(yàn)設(shè)置
然后,再打開選項(xiàng)面板,勾選所需的統(tǒng)計(jì)數(shù)值(建議勾選描述)與缺失值的處理方式。

圖4:選項(xiàng)設(shè)置
完成檢驗(yàn)設(shè)置后,運(yùn)行檢驗(yàn)。
如圖5所示,在KS檢驗(yàn)結(jié)果中,可以看到,當(dāng)前檢驗(yàn)的分布是正態(tài)分布,而其漸進(jìn)顯著性數(shù)值為0.00<0.05,因此拒絕原假設(shè),也就是說,示例身高樣本數(shù)據(jù)不符合正態(tài)分布。
圖5:KS檢驗(yàn)結(jié)果
二、Q-Q圖
Q-Q圖,是Quantile-Quantile圖的簡(jiǎn)稱,通過計(jì)算兩個(gè)數(shù)據(jù)的分位數(shù)來繪制散點(diǎn)圖,從而檢驗(yàn)數(shù)據(jù)是否服從理論分布。
正態(tài)Q-Q圖,即實(shí)測(cè)值與預(yù)期的正態(tài)值組成的散點(diǎn)圖。如果數(shù)據(jù)服從正態(tài)分布的話,數(shù)值在Q-Q圖的分布會(huì)呈現(xiàn)直線型;反之則不服從正態(tài)分布。
Q-Q圖屬于SPSS描述統(tǒng)計(jì)中的一種,如圖6所示,依次單擊分析-描述統(tǒng)計(jì)-Q-Q圖。

圖6:Q-Q圖功能
如圖7所示,基于本文的數(shù)據(jù)驗(yàn)證目的—驗(yàn)證身高樣本數(shù)據(jù)是否服從正態(tài)分布,需將身高變量添加到變量選項(xiàng),并在檢驗(yàn)分布中選取“正態(tài)”選項(xiàng)。其他選項(xiàng),一般情況下,保持默認(rèn)即可。

圖7:Q-Q圖設(shè)置
完成以上設(shè)置后,運(yùn)行檢驗(yàn)。
從圖8的身高正態(tài)Q-Q圖看到,散點(diǎn)圖上的數(shù)值似乎接近與直線很接近。但由于身高的差別數(shù)值較小,我們還需要具體看看數(shù)值與直線的偏離大小。

圖8:身高正態(tài)Q-Q圖
從圖8的去趨勢(shì)正態(tài)Q-Q圖看到,實(shí)際上,實(shí)測(cè)值與正態(tài)的偏差還是比較大的,因此,不能確切說明身高樣本數(shù)據(jù)服從正態(tài)分布。

圖9:去趨勢(shì)正態(tài)Q-Q圖
三、小結(jié)
綜上所示,通過正態(tài)Q-Q圖,我們可以直觀地觀察到數(shù)據(jù)的正態(tài)分布情況,但當(dāng)數(shù)值與直線有一定偏離的情況下,還需要借助去趨勢(shì)正態(tài)Q-Q圖,以及KS檢驗(yàn)來進(jìn)一步檢驗(yàn)數(shù)據(jù)的正態(tài)性。
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評(píng)價(jià)。 |