樣本方差

樣本方差

數學術語

先求出總體各單位變量值與其算術平均數的離差的平方，然後再對此變量取平均數，就叫做樣本方差。樣本方差用來表示一列數的變異程度。樣本均值又叫樣本均數。即為樣本的均值。均值是指在一組數據中所有數據之和再除以數據的個數。

中文名:樣本方差
外文名:sample Variance
類别:
主管部門:
學科:概率論
表示:一列數的變異程度
應用:人口差異的統計
相關名詞:樣本均值

公式

樣本方差的公式為其中為樣本均值。

簡介

在許多實際情況下，人口的真實差異事先是不知道的，必須以某種方式計算。當處理非常大的人口時，不可能對人口中的每個物體進行計數，因此必須對人口樣本進行計算。樣本方差也可以應用于從該分布的樣本的連續分布的方差的估計。

樣本方差的無偏性

我們從一個樣本取n個值y1，...，yn，其中n 偏差的平均值：

這裡，表示樣本均值。

由于是随機選擇的，所以和是随機變量。他們的預期值可以通過從群體中的大小為n的所有可能樣本的集合進行平均來評估。對于，有

因此給出了基于因子的人口方差的估計值。被稱為偏樣本方差。糾正該偏差之後形成無偏樣本方差：

估計值可以簡單地稱為樣本方差。同樣的證明也适用于從連續概率分布中抽取的樣本。

例如，n=5個樣本觀測值值為3,4,4,5,4，則樣本均值，樣本方差。樣本方差是常用的統計量之一，是描述一組數據變異程度或分散程度大小的指标。

實際上，樣本方差可以理解成是對所給總體方差的一個無偏估計。E(S^2)=DX。

n-1的使用稱為貝塞爾校正（Bessel's correction），也用于樣本協方差和樣本标準偏差（方差平方根）。平方根是一個凹函數，因此引入負偏差（由Jensen不等式），這取決于分布，因此校正樣本标準偏差（使用貝塞爾校正）有偏差。标準偏差的無偏估計是技術上的問題，對于使用術語n-1.5的正态分布，形成無偏估計。

無偏樣本方差是函數ƒ（y1，y2）=（y1-y2）2/2的U統計量，這意味着它是通過對群體的兩個樣本統計平均得到的。

樣本方差分布

作為随機變量的函數，樣本方差本身就是一個随機變量，研究其分布是很自然的。在yi是來自正态分布的獨立觀察的情況下，Cochran定理表明s2服從卡方分布：

所以可求：

和

如果yi獨立同分布，但不一定是正态分布，那麼

如果大數定律的條件對于平方觀測值同樣适用，則s2是σ2的一緻估計量。可以看出，估計的方差趨于零。在Kenney and Keeping（1951：164），Rose和Smith（2002：264）和Weisstein（n.d.）中給出了漸近等效的公式。

正态總體的樣本均值和樣本方差相互獨立。

相關詞條

相關搜索

樣本方差

其它詞條