非參數檢驗

非參數檢驗

統計分析方法的重要組成部分
非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本内容。參數檢驗是在總體分布形式已知的情況下,對總體分布的參數如均值、方差等進行推斷的方法。但是,在數據分析過程中,由于種種原因,人們往往無法對總體分布形态作簡單假定,此時參數檢驗的方法就不再适用了。非參數檢驗正是一類基于這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形态等進行推斷的方法。由于非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為“非參數”檢驗。[1]
    中文名:非參數檢驗 外文名: 别名: 重要性:統計分析方法的重要組成部分 推斷方法:四種 檢驗方法:十七種 應用學科:心理學

相關簡介

SPSS單樣本非參數檢驗是對單個總體的分布形态等進行推斷的方法,其中包括卡方檢驗、二項分布檢驗、K-S檢驗以及變量值随機性檢驗等方法。

總體分布的卡方檢驗

例如,醫學家在研究心髒病人猝死人數與日期的關系時發現:一周之中,星期一心髒病人猝死者較多,其他日子則基本相當。當天的比例近似為2.8:1:1:1:1:1:1。現收集到心髒病人死亡日期的樣本數據,推斷其總體分布是否與上述理論分布相吻合。

卡方檢驗方法可以根據樣本數據,推斷總體分布與期望分布或某一理論分布是否存在顯着差異,是一種吻合性檢驗,通常适于對有多項分類值的總體分布的分析。它的原假設是:樣本來自的總體分布與期望分布或某一理論分布無差異。

二項分布檢驗

在生活中有很多數據的取值是二值的,例如,人群可以分成男性和女性,産品可以分成合格和不合格,學生可以分成三好學生和非三好學生,投擲硬币實驗的結果可以分成出現正面和出現反面等。通常将這樣的二值分别用1或0表示。如果進行n次相同的實驗,則出現兩類(1或0)的次數可以用離散型随機變量X來描述。如果随機變量X為1的概率設為P,則随機變量X值為0的概率Q便等于1-P,形成二項分布。

SPSS的二項分布檢驗正是要通過樣本數據檢驗樣本來自的總體是否服從指定的概率為P的二項分布,其原假設是:樣本來自的總體與指定的二項分布無顯着差異。

從某産品中随機抽取23個樣品進行檢測并得到檢測結果。用1表示一級品,用0表示非一級品。根據抽樣結果驗證該批産品的一級品率是否為90%。

單樣本K-S檢驗

K-S檢驗方法能夠利用樣本數據推斷樣本來自的總體是否服從某一理論分布,是一種拟合優度的檢驗方法,适用于探索連續型随機變量的分布。

例如,收集一批周歲兒童身高的數據,需利用樣本數據推斷周歲兒童總體的身高是否服從正态分布。再例如,利用收集的住房狀況調查的樣本數據,分析家庭人均住房面積是否服從正态分布。

單樣本K-S檢驗的原假設是:樣本來自的總體與指定的理論分布無顯着差異,SPSS的理論分布主要包括正态分布、均勻分布、指數分布和泊松分布等。

變量值随機性檢驗

變量值随機性檢驗通過對樣本變量值的分析,實現對總體的變量值出現是否随機進行檢驗。

例如,在投硬币時,如果以1表示出現的是正面,以0表示出現的是反面,在進行了若幹次投币後,将會得到一個以1,0組成的變量值序列。這時可能會分析“硬币出現正反面是否是随機的”這樣的問題。

變量值随機性檢驗正是解決這類問題的一個有效方法。它的原假設是:總體變量值出現是随機的。

變量随機性檢驗的重要依據是遊程。所謂遊程是樣本序列中連續出現相同的變量值的次數。可以直接理解,如果硬币的正反面出現是随機的,那麼在數據序列中,許多個1或許多個0連續出現的可能性将不太大,同時,1和0頻繁交叉出現的可能性也會較小。因此,遊程數太大或太小都将表明變量值存在不随機的現象。

例:為檢驗某耐壓設備在某段時間内工作是否持續正常,測試并記錄下該時間段内各個時間點上的設備耐壓的數據。現采用遊程檢驗方法對這批數據進行分析。如果耐壓數據的變動是随機的,可認為該設備工作一直正常,否則認為該設備有不能正常工作的現象。

檢驗方法

獨立樣本的非參數檢驗

兩獨立樣本的非參數檢驗是在對總體分布不甚了解的情況下,通過對兩組獨立樣本的分析來推斷樣本來自的兩個總體的分布等是否存在顯着差異的方法。獨立樣本是指在一個總體中随機抽樣對在另一個總體中随機抽樣沒有影響的情況下所獲得的樣本。

SPSS中提供了多種兩獨立樣本的非參數檢驗方法,其中包括曼-惠特尼U檢驗、K-S檢驗、W-W遊程檢驗、極端反應檢驗等。

某工廠用甲乙兩種不同的工藝生産同一種産品。如果希望檢驗兩種工藝下産品的使用是否存在顯着差異,可從兩種工藝生産出的産品中随機抽樣,得到各自的使用壽命數據。

甲工藝:675 682 692 679 669 661 693

乙工藝:662 649 672 663 650 651 646 652

曼-惠特尼U檢驗

兩獨立樣本的曼-惠特尼U檢驗可用于對兩總體分布的比例判斷。其原假設:兩組獨立樣本來自的兩總體分布無顯着差異。曼-惠特尼U檢驗通過對兩組樣本平均秩的研究來實現判斷。秩簡單說就是變量值排序的名次,可以将數據按升序排列,每個變量值都會有一個在整個變量值序列中的位置或名次,這個位置或名次就是變量值的秩。

K-S檢驗

K-S檢驗不僅能夠檢驗單個總體是否服從某一理論分布,還能夠檢驗兩總體分布是否存在顯着差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯着差異。

這裡是以變量值的秩作為分析對象,而非變量值本身。

遊程檢驗

單樣本遊程檢驗是用來檢驗變量值的出現是否随機,而兩獨立變量的遊程檢驗則是用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯着差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯着差異。

兩獨立樣本的遊程檢驗與單樣本遊程檢驗的思想基本相同,不同的是計算遊程數的方法。兩獨立樣本的遊程檢驗中,遊程數依賴于變量的秩。

極端反應檢驗

極端反應檢驗從另一個角度檢驗兩獨立樣本所來自的兩總體分布是否存在顯着差異。其原假設是:兩獨立樣本來自的兩總體的分布無顯着差異。

基本思想是:将一組樣本作為控制樣本,另一組樣本作為實驗樣本。以控制樣本作為對照,檢驗實驗樣本相對于控制樣本是否出現了極端反應。如果實驗樣本沒有出現極端反應,則認為兩總體分布無顯着差異,相反則認為存在顯着差異。

多獨立樣本的非參數檢驗

多獨立樣本的非參數檢驗是通過分析多組獨立樣本數據,推斷樣本來自的多個總體的中位數或分布是否存在顯着差異。多組獨立樣本是指按獨立抽樣方式獲得的多組樣本。

SPSS提供的多獨立樣本非參數檢驗的方法主要包括中位數檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗。

例:希望對北京、上海、成都、廣州四個城市的周歲兒童的身高進行比較分析。采用獨立抽樣方式獲得四組獨立樣本。

中位數檢驗

中位數檢驗通過對多組獨立樣本的分析,檢驗它們來自的總體的中位數是否存在顯着差異。其原假設是:多個獨立樣本來自的多個總體的中位數無顯着差異。

基本思想是:如果多個總體的中位數無顯着差異,或者說多個總體有共同的中位數,那麼這個共同的中位數應在各樣本組中均處在中間位置上。于是,每組樣本中大于該中位數或小于該中位數的樣本數目應大緻相同。

Kruskal-Wallis檢驗

Kruskal-Wallis檢驗實質是兩獨立樣本的曼-惠特尼U檢驗在多個樣本下的推廣,也用于檢驗多個總體的分布是否存在顯着差異。其原假設是:多個獨立樣本來自的多個總體的分布無顯着差異。

基本思想是:首先,将多組樣本數據混合并按升序排序,求出各變量值的秩;然後,考察各組秩的均值是否存在顯着差異。容易理解:如果各組秩的均值不存在顯着差異,則是多組數據充分混合,數值相差不大的結果,可以認為多個總體的分布無顯着差異;反之,如果各組秩的均值存在顯着差異,則是多組數據無法混合,某些組的數值普遍偏大,另一些組的數值普遍偏小的結果,可以認為多個總體的分布有顯着差異。

Jonckheere-Terpstra檢驗

Jonckheere-Terpstra檢驗也是用于檢驗多個獨立樣本來自的多個總體的分布是否存在顯着差異的非參數檢驗方法,其原假設是:多個獨立樣本來自的多個總體的分布無顯着差異。

基本思想與兩獨立樣本的曼-惠特尼U檢驗類似,也是計算一組樣本的觀察值小于其他組樣本的觀察值的個數。

兩配對樣本的非參數檢驗

兩配對樣本的非參數檢驗是對總體分布不甚了解的情況下,通過對兩組配對樣本的分析,推斷樣本來自的兩個總體的分布是否存在顯着差異的方法。

SPSS提供的兩配對樣本非參數檢驗的方法主要包括McNemar檢驗、符号檢驗、Wilcoxon符号秩檢驗等。

例:要檢驗一種新的訓練方法是否對提高跳遠運動員的成績有顯着效果,可以收集一批跳遠運動員在使用新訓練方法前後的跳遠最好成績,這樣的兩組樣本便是配對的。再例如,分析不同廣告形式是否對商品的銷售産生顯着影響,可以比較幾種不同商品在不同廣告形式下的銷售額數據(其他條件保持基本穩定)。這裡不同廣告形式下的若幹組商品銷售額樣本便是配對樣本。可見,配對樣本的樣本數是相同的,且各樣本值的先後次序是不能随意更改的。

McNemar檢驗

是一種變化顯着性檢驗,它将研究對象自身作為對照者檢驗其“前後”的變化是否顯着。其原假設是:兩配對樣本來自的兩總體的分布無顯着差異。

分析學生在學習“統計學”課程前後對統計學重要性的認知程度是否發生了顯着改變,可以随機收集一批學生在學習“統計學”之前以及學完以後認為統計學是否重要的樣本數據(0表示“不重要”,1表示“重要”)。

應該看到:兩配對樣本的McNemar檢驗分析的變量是二值變量。因此,在實際應用中,如果變量不是二值變量,應首先進行數據轉換後方可采用該方法,因而它在應用範圍方面有一定的局限性。

符号檢驗

符号檢驗也是用來檢驗兩配對樣本所來自的總體的分布是否存在顯着差異的非參數方法。其原假設是:兩配對樣本來自的兩總體的分布無顯着差異。

首先,分别用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正号,差值為負則記為負号。然後,将正号的個數與負号的個數進行比較,容易理解:如果正号個數和負号個數大緻相當,則可以認為第二組樣本大于第一組樣本變量值的個數,與第二組樣本小于第一組樣本的變量值個數是大緻相當的,從總體上講,這兩個組配對樣本的數據分布差距較小;相反,如果正号個數和負号個數相差較多,則可以認為兩個配對樣本的數據分布差距較大。

應該看到:配對樣本的符号檢驗注重對變化方向的分析,隻考慮數據變化的性質,即是變大了還是變小了,但沒有考慮變化幅度,即大了多少,小了多少,因而對數據利用是不充分的。

Wilcoxon符号秩檢驗

Wilcoxon符号秩檢驗也是通過分析兩配對樣本,對樣本來自的兩總體的分布是否存在差異進行判斷。其原假設是:兩配對樣本來自的兩總體的分布無顯着差異。

基本思想是:首先,按照符号檢驗的方法,分布用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正号,為負則記為負号,并同時保存差值數據;然後,将差值變量按升序排序,并求出差值變量的秩;最後,分布計算正号秩總和W+和負号秩和W-。

多配對樣本的非參數檢驗

多配對樣本的非參數檢驗是通過分析多組配對樣本數據,推斷樣本來自的多個總體的中位數或分布是否存在顯着差異。

例如,收集乘客對多家航空公司是否滿意的數據,分析航空公司的服務水平是否存在顯着差異;再例如,收集不同促銷形式下若幹種商品的銷售額數據,分析比較不同促銷形式的效果,再如,收集多名評委對同一批歌手比賽打分的數據,分析評委的打分标準是否一緻,等等。

這些問題都可以通過多配對樣本非參數檢驗方法進行分析。SPSS中的多配對樣本的非參數檢驗方法主要包括Friedman檢驗、Cochran Q檢驗、Kendall協同系數檢驗等。

Friedman檢驗

Friedman檢驗是利用秩實現對多個總體分布是否存在顯着差異的非參數檢驗方法,其原假設是:多個配對樣本來自的多個總體分布無顯着差異。

SPSS将自動計算Friedman統計量和對應的概率P值。如果概率P值小于給定的顯着性水平0.05,則拒絕原假設,認為各組樣本的秩存在顯着差異,多個配對樣本來自的多個總體的分布有顯着差異;反之,則不能拒絕原假設,可以認為各組樣本的秩不存在顯着性差異。

基于上述基本思路,多配對樣本的Friedman檢驗時,首先以行為單位将數據按升序排序,并求得各變量值在各自行中的秩;然後,分别計算各組樣本下的秩總和與平均秩。多配對樣本的Friedman檢驗适于對定距型數據的分析。

Cochran Q檢驗

通過對多個配對樣本的分析,推斷樣本來自的多個總體的分布是否存在顯着差異。其原假設是:多個配對樣本來自的多個總體的分布無顯着差異。

Cochran Q檢驗适合對二值品質型數據的分析。如二分的評價:1代表滿意,0代表不滿意。

Kendall協同系數檢驗

它也是一種對多配對樣本進行檢驗的非參數檢驗方法,與第一種檢驗方法向結合,可方便地實現對評判者的評判标準是否一緻的分析。其原假設是:評判者的評判标準不一緻。

有6名歌手參加比賽,4名評委進行評判打分,現在需要根據數據推斷這4個評委的評判标準是否一緻。(見下頁具體分析)

如果将每個被評判者對象的分數看做來自多個總體的配對樣本,那麼該問題就能夠轉化為多配對樣本的非參數檢驗問題,仍可采用Friedman檢驗,于是相應的原假設便轉化為:多個配對樣本來自的多個總體的分布無顯着差異。但對該問題的分析是需要繼續延伸的,并非站在對6名歌手的演唱水平是否存在顯着差異的角度進行分析,而是在認定他們存在差異的前提下繼續判斷4個評委的打分标準是否一緻。

如果利用Friedman檢驗出各總體的分布不存在顯着差異,即各個歌手的秩不存在顯着差異,則意味着評委的打分存在随意性,評分标準不一緻。原因在于:如果各個評委的評判标準是一緻的,那麼對于某個歌手來說将獲得一緻的分數,也就是說,評委給出的若幹個評分的秩應完全相同,這就必然會導緻各歌手評分的秩有較大的差異

相關詞條

相關搜索

其它詞條