t檢驗:戈斯特為了觀測釀酒品質而發明的-中文百科頻道

簡介

t檢驗是用t分布理論來推論差異發生的概率，從而比較兩個平均數的差異是否顯著。它與Z檢驗、卡方檢驗并列。

t檢驗是

戈斯特

為了觀測釀酒質量而發明的。戈斯特在位于都柏林的健力士釀酒廠擔任統計學家，基于Claude Guinness聘用從牛津大學和劍橋大學出來的最好的畢業生以将生物化學及統計學應用到健力士工業程序的創新政策。戈斯特于1908年在Biometrika上公布t檢驗，但因其老闆認為其為商業機密而被迫使用筆名（學生）。實際上，戈斯特的真實身份不隻是其它統計學家不知道，連其老闆也不知道。

分類原理

t檢驗

t檢驗分為單總體檢驗和雙總體檢驗。

單總體t檢驗時檢驗一個樣本平均數與一個已知的總體平均數的差異是否顯著。當總體分布是正态分布，如總體标準差未知且樣本容量小于30，那麼樣本平均數與總體平均數的離差統計量呈t分布。

單總體t檢驗統計量為：

雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體t檢驗又分為兩種情況，一是獨立樣本t檢驗，一是配對樣本t檢驗。

獨立樣本t檢驗統計量為：

S1和S2為兩樣本方差；n1和n2為兩樣本容量。（上面的公式是1/n1+1/n2不是減！）

配對樣本t檢驗統計量為：

t檢驗的适用條件

(1)已知一個總體均數；

(2)可得到一個樣本均數及該樣本标準差；

(3)樣本來自正态或近似正态總體。

t檢驗步驟

以單總體t檢驗為例說明:

問題：難産兒出生體重n=35，X拔=3.42，S=0.40，一般嬰兒出生體重μ0=3.30（大規模調查獲得），問相同否？

解：1.建立假設、确定檢驗水準α

H0：μ=μ0（無效假設，nullhypothesis）

H1：μ≠μ0（備擇假設,alternative hypothesis，）

雙側檢驗，檢驗水準:α=0.05

2.計算檢驗統計量

3.查相應界值表，确定P值，下結論

查附表1，t0.05/2.34=2.032,t0.05，按α=0.05水準，不拒絕H0，兩者的差别無統計學意義

t檢驗的來曆

當總體呈正态分布，如果總體标準差未知，而且樣本容量<30，那麼這時一切可能的樣本平均數與總體平均數的離差統計量呈分布。

檢驗是用分布理論來推論差異發生的概率，從而比較兩個平均數的差異是否顯著。檢驗分為單總體檢驗和雙總體檢驗。

1.單總體檢驗

單總體檢驗是檢驗一個樣本平均數與一已知的總體平均數的差異是否顯著。當總體分布是正态分布，如總體标準差未知且樣本容量<30，那麼樣本平均數與總體平均數的離差統計量呈分布。檢驗統計量為：

如果樣本是屬于大樣本（>30）也可寫成：

在這裡，為樣本平均數與總體平均數的離差統計量；

為樣本平均數；

為總體平均數；

為樣本标準差；

為樣本容量。

例：某校二年級學生期中英語考試成績，其平均分數為73分，标準差為17分，期末考試後，随機抽取20人的英語成績，其平均分數為79.2分。問二年級學生的英語成績是否有顯著性進步？

檢驗步驟如下：

第一步建立原假設=73

第二步計算值

第三步判斷

因為，以0.05為顯著性水平，查值表，臨界值，而樣本離差的1.63小與臨界值2.093。所以，接受原假設，即進步不顯著。

2.雙總體檢驗

雙總體檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體檢驗又分為兩種情況，一是相關樣本平均數差異的顯著性檢驗，用于檢驗匹配而成的兩組被試獲得的數據或同組被試在不同條件下所獲得的數據的差異性，這兩種情況組成的樣本即為相關樣本。二是獨立樣本平均數的顯著性檢驗。各實驗處理組之間毫無相關存在，即為獨立樣本。該檢驗用于檢驗兩組非相關樣本被試所獲得的數據的差異性。

現以相關檢驗為例，說明檢驗方法。因為獨立樣本平均數差異的顯著性檢驗完全類似，隻不過。

相關樣本的檢驗公式為：

在這裡，分别為兩樣本平均數；

分别為兩樣本方差；

為相關樣本的相關系數。

例：在小學三年級學生中随機抽取10名學生，在學期初和學期末分别進行了兩次推理能力測驗，成績分别為79.5和72分，标準差分别為9.124,9.940。問兩次測驗成績是否有顯著地差異？

檢驗步驟為：

第一步建立原假設

第二步計算值=3.459。

第三步判斷

根據自由度，查值表，由于實際計算出來的=3.495>3.250，則，故拒絕原假設。

結論為：兩次測驗成績有及其顯著地差異。

由以上可以看出，對平均數差異顯著性檢驗比較複雜，究竟使用檢驗還是使用檢驗必須根據具體情況而定，為了便于掌握各種情況下的檢驗或檢驗，我們用以下一覽表圖示加以說明。

已知時，用單總體

未知時，用在這裡，表示總體标準差的估計量，它與樣本标準差的關系是：

已知且是獨立樣本時，用

是獨立大樣本時，用

雙總體，未知

是獨立小樣本時，用

是相關樣本時，用

以上對平均數差異的顯著性檢驗的理論前提是假設兩個總體的方差是相同的，至少沒有顯著性差異。對兩個總體的方差是否有顯著性差異所進行的檢驗稱為方差齊性檢驗，即必須進行檢驗。

t檢驗注意事項

1、選用的檢驗方法必須符合其适用條件(注意：t檢驗的前提是資料服從正态分布)。理論上，即使樣本量很小時，也可以進行t檢驗。（如樣本量為10，一些學者聲稱甚至更小的樣本也行），隻要每組中變量呈正态分布，兩組方差不會明顯不同。如上所述，可以通過觀察數據的分布或進行正态性檢驗估計數據的正态假設。方差齊性的假設可進行F檢驗，或進行更有效的Levene's檢驗。如果不滿足這些條件，隻好使用非參數檢驗代替t檢驗進行兩組間均值的比較。

2、區分單側檢驗和雙側檢驗。單側檢驗的界值小于雙側檢驗的界值，因此更容易拒絕，犯第Ⅰ錯誤的可能性大。t檢驗中的p值是接受兩均值存在差異這個假設可能犯錯的概率。在統計學上，當兩組觀察對象總體中的确不存在差别時，這個概率與我們拒絕了該假設有關。一些學者認為如果差異具有特定的方向性，我們隻要考慮單側概率分布，将所得到t-檢驗的P值分為兩半。另一些學者則認為無論何種情況下都要報告标準的雙側t檢驗概率。

3、假設檢驗的結論不能絕對化。當一個統計量的值落在臨界域内，這個統計量是統計上顯著的，這時拒絕虛拟假設。當一個統計量的值落在接受域中，這個檢驗是統計上不顯著的，這是不拒絕虛拟假設H0。因為，其不顯著結果的原因有可能是樣本數量不夠拒絕H0，有可能犯第Ⅰ類錯誤。

4、正确理解P值與差别有無統計學意義。P越小，不是說明實際差别越大，而是說越有理由拒絕H0，越有理由說明兩者有差異，差别有無統計學意義和有無專業上的實際意義并不完全相同。

5、假設檢驗和可信區間的關系結論具有一緻性差異：提供的信息不同區間估計給出總體均值可能取值範圍，但不給出确切的概率值，假設檢驗可以給出H0成立與否的概率。

6、涉及多組間比較時，慎用t檢驗。

科研實踐中，經常需要進行兩組以上比較，或含有多個自變量并控制各個自變量單獨效應後的各組間的比較，（如性别、藥物類型與劑量），此時，需要用方差分析進行數據分析，方差分析被認為是T檢驗的推廣。在較為複雜的設計時，方差分析具有許多t-檢驗所不具備的優點。（進行多次的T檢驗進行比較設計中不同格子均值時）。