樣本方差

樣本方差

數學術語
先求出總體各單位變量值與其算術平均數的離差的平方,然後再對此變量取平均數,就叫做樣本方差。樣本方差用來表示一列數的變異程度。樣本均值又叫樣本均數。即為樣本的均值。均值是指在一組數據中所有數據之和再除以數據的個數。
  • 中文名:樣本方差
  • 外文名:sample Variance
  • 類别:
  • 主管部門:
  • 學 科:概率論
  • 表 示:一列數的變異程度
  • 應 用:人口差異的統計
  • 相關名詞:樣本均值

公式

樣本方差的公式為其中為樣本均值。

簡介

在許多實際情況下,人口的真實差異事先是不知道的,必須以某種方式計算。 當處理非常大的人口時,不可能對人口中的每個物體進行計數,因此必須對人口樣本進行計算。樣本方差也可以應用于從該分布的樣本的連續分布的方差的估計。

樣本方差的無偏性

我們從一個樣本取n個值y1,...,yn,其中n 偏差的平均值:

這裡, 表示樣本均值。

由于 是随機選擇的,所以 和 是随機變量。 他們的預期值可以通過從群體中的大小為n的所有可能樣本  的集合進行平均來評估。 對于  ,有

因此  給出了基于因子 的人口方差的估計值。  被稱為偏樣本方差。 糾正該偏差之後形成無偏樣本方差:

估計值可以簡單地稱為樣本方差。 同樣的證明也适用于從連續概率分布中抽取的樣本。

例如,n=5個樣本觀測值值為3,4,4,5,4,則樣本均值, 樣本方差 。樣本方差是常用的統計量之一,是描述一組數據變異程度或分散程度大小的指标。

實際上,樣本方差可以理解成是對所給總體方差的一個無偏估計。E(S^2)=DX。

n-1的使用稱為貝塞爾校正(Bessel's correction),也用于樣本協方差和樣本标準偏差(方差平方根)。 平方根是一個凹函數,因此引入負偏差(由Jensen不等式),這取決于分布,因此校正樣本标準偏差(使用貝塞爾校正)有偏差。 标準偏差的無偏估計是技術上的問題,對于使用術語n-1.5的正态分布,形成無偏估計。

無偏樣本方差是函數ƒ(y1,y2)=(y1-y2)2/2的U統計量,這意味着它是通過對群體的兩個樣本統計平均得到的。

樣本方差分布

作為随機變量的函數,樣本方差本身就是一個随機變量,研究其分布是很自然的。 在yi是來自正态分布的獨立觀察的情況下,Cochran定理表明s2服從卡方分布:

所以可求:

如果yi獨立同分布,但不一定是正态分布,那麼

如果大數定律的條件對于平方觀測值同樣适用,則s2是σ2的一緻估計量。 可以看出,估計的方差趨于零。 在Kenney and Keeping(1951:164),Rose和Smith(2002:264)和Weisstein(n.d.)中給出了漸近等效的公式。

正态總體的樣本均值和樣本方差相互獨立。

相關詞條

相關搜索

其它詞條