樣本方差

样本方差

数学术语

先求出总体各单位变量值与其算术平均数的离差的平方，然后再对此变量取平均数，就叫做样本方差。样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。均值是指在一组数据中所有数据之和再除以数据的个数。

中文名:样本方差
外文名:sample Variance
类别:
主管部门:
学科:概率论
表示:一列数的变异程度
应用:人口差异的统计
相关名词:样本均值

公式

样本方差的公式为其中为样本均值。

简介

在许多实际情况下，人口的真实差异事先是不知道的，必须以某种方式计算。当处理非常大的人口时，不可能对人口中的每个物体进行计数，因此必须对人口样本进行计算。样本方差也可以应用于从该分布的样本的连续分布的方差的估计。

样本方差的无偏性

我们从一个样本取n个值y1，...，yn，其中n 偏差的平均值：

这里，表示样本均值。

由于是随机选择的，所以和是随机变量。他们的预期值可以通过从群体中的大小为n的所有可能样本的集合进行平均来评估。对于，有

因此给出了基于因子的人口方差的估计值。被称为偏样本方差。纠正该偏差之后形成无偏样本方差：

估计值可以简单地称为样本方差。同样的证明也适用于从连续概率分布中抽取的样本。

例如，n=5个样本观测值值为3,4,4,5,4，则样本均值，样本方差。样本方差是常用的统计量之一，是描述一组数据变异程度或分散程度大小的指标。

实际上，样本方差可以理解成是对所给总体方差的一个无偏估计。E(S^2)=DX。

n-1的使用称为贝塞尔校正（Bessel's correction），也用于样本协方差和样本标准偏差（方差平方根）。平方根是一个凹函数，因此引入负偏差（由Jensen不等式），这取决于分布，因此校正样本标准偏差（使用贝塞尔校正）有偏差。标准偏差的无偏估计是技术上的问题，对于使用术语n-1.5的正态分布，形成无偏估计。

无偏样本方差是函数ƒ（y1，y2）=（y1-y2）2/2的U统计量，这意味着它是通过对群体的两个样本统计平均得到的。

样本方差分布

作为随机变量的函数，样本方差本身就是一个随机变量，研究其分布是很自然的。在yi是来自正态分布的独立观察的情况下，Cochran定理表明s2服从卡方分布：

所以可求：

和

如果yi独立同分布，但不一定是正态分布，那么

如果大数定律的条件对于平方观测值同样适用，则s2是σ2的一致估计量。可以看出，估计的方差趋于零。在Kenney and Keeping（1951：164），Rose和Smith（2002：264）和Weisstein（n.d.）中给出了渐近等效的公式。

正态总体的样本均值和样本方差相互独立。

相关词条

相关搜索

样本方差

其它词条