标準差

标準差

統計學術語
标準差(Standard Deviation),中文環境中又常稱均方差,但不同于均方誤差(mean squared error,均方誤差是各數據偏離平均數的距離平方的平均數,也即誤差平方和的平均數,計算公式形式上接近方差,它的開方叫均方根誤差,均方根誤差才和标準差形式上接近),标準差是離均差平方和平均後的方根,用σ表示。标準差是方差的算術平方根。标準差能反映一個數據集的離散程度。平均數相同的,标準差未必相同。
    中文名:标準差 外文名: 所屬學科: 英文名:Standard Deviation 别稱:均方差 應用學科:統計學 符号:用σ表示

簡介

标準差(Standard Deviation),在概率統計中最常使用作為統計分布程度(statistical dispersion)上的測量。标準差定義是總體各單位标準值與其平均數離差平方的算術平均數的平方根。它反映組内個體間的離散程度。即觀察值圍繞均數的分布較離散,均數的代表性較差。反之,标準差越小,表明觀察值間的變異較小,觀察值圍繞均數的分布較密集,均數的代表性較好。測量到分布程度的結果,原則上具有兩種性質:為非負數值,與測量資料具有相同單位。一個總量的标準差或一個随機變量的标準差,及一個子集合樣品數的标準差之間,有所差别。

标準計算公式:

假設有一組數值X1,X2,X3,......XN(皆為實數),其平均值為μ,公式如圖1。

标準差也被稱為标準偏差,或者實驗标準差

簡單來說,标準差是一組數據平均值分散程度的一種度量。一個較大的标準差,代表大部分數值和其平均值之間差異較大;一個較小的标準差,代表這些數值較接近平均值。

标準差可以當作不确定性的一種測量。例如在物理科學中,做重複性測量時,測量數值集合的标準差代表這些測量的精确度。當要決定測量值是否符合預測值,測量值的标準差占有決定性重要角色:如果測量平均值與預測值相差太遠(同時與标準差數值做比較),則認為測量值與預測值互相矛盾。這很容易理解,因為如果測量值都落在一定數值範圍之外,可以合理推論預測值是否正确。

标準差應用于投資上,可作為量度回報穩定性的指标。标準差數值越大,代表回報遠離過去平均數值,回報較不穩定故風險越高。相反,标準差數值越小,代表回報較為穩定,風險亦較小。

例如,A、B兩組各有6位學生參加同一次語文測驗,A組的分數為95、85、75、65、55、45,B組的分數為73、72、71、69、68、67。這兩組的平均數都是70,但A組的标準差為18.71分,B組的标準差為2.37分(此數據是在R統計軟件中運行獲得),說明A組學生之間的差距要比B組學生之間的差距大得多。

如是總體(即估算總體方差),根号内除以n(對應excel函數:STDEVP);

如是抽樣(即估算樣本方差),根号内除以(n-1)(對應excel函數:STDEV);

因為我們大量接觸的是樣本,所以普遍使用根号内除以(n-1)。

公式意義

所有數減去其平均值的平方和,所得結果除以該組數之個數(或個數減一,即變異數),再把所得值開根号,所得之數就是這組數據的标準差。

深藍區域是距平均值小于一個标準差之内的數值範圍。在正态分布中,此範圍所占比率為全部數值之68%。根據正态分布,兩個标準差之内(深藍,藍)的比率合起來為95%。根據正态分布,正負三個标準差之内(深藍,藍,淺藍)的比率合起來為99%。

計算公式

假設有一組數值x1,...,xN(皆為實數),其平均值為:

此組數值的标準差為:

一個較快求解的方式為:

一随機變量X的标準差定義為:

須注意并非所有随機變量都具有标準差,因為有些随機變量不存在期望值。如果随機變量X為x1,...,xN具有相同機率,則可用上述公式計算标準差。從一大組數值當中取出一樣本數值組合x1,...,xn,常定義其樣本标準差:

函數

Excel中有STDEV、STDEVP;STDEVA,STDEVPA四個函數,分别表示樣本标準差、總體标準差;包含邏輯值運算的樣本标準差、包含邏輯值運算的總體标準差(excel用的是“标準偏差”字樣)。

在計算方法上的差異是:樣本标準差^2=(樣本方差/(數據個數-1));總體标準差^2=(總體方差/(數據個數))。

函數的excel分解:

⑴stdev()函數可以分解為(假設樣本數據為A1:E10這樣一個矩陣):

stdev(A1:E10)=sqrt(DEVSQ(A1:E10)/(COUNT(A1:E10)-1))

⑵stdevp()函數可以分解為(假設總體數據為A1:E10這樣一個矩陣):

stdev(A1:E10)=sqrt(DEVSQ(A1:E10)/(COUNT(A1:E10)))

同樣的道理stdeva()與stdevpa()也有同樣的分解方法。

外彙術語

标準差指統計上用于衡量一組數值中某一數值與其平均值差異程度的指标。标準差被用來評估價格可能的變化或波動程度。标準差越大,價格波動的範圍就越廣,股票等金融工具表現的波動就越大。

在excel中調用函數“STDEV“

估算樣本的标準偏差。标準偏差反映相對于平均值(mean)的離散程度。

離散度

标準差是反應一組數據離散程度最常用的一種量化形式,是表示精密确的最要指标。說起标準差首先得搞清楚它出現的目的。我們使用方法去檢測它,但檢測方法總是有誤差的,所以檢測值并不是其真實值。檢測值與真實值之間的差距就是評價檢測方法最有決定性的指标。但是真實值是多少,不得而知。因此怎樣量化檢測方法的準确性就成了難題。這也是臨床工作質控的目的:保證每批實驗結果的準确可靠。

雖然樣本的真實值是不可能知道的,但是每個樣本總是會有一個真實值的,不管它究竟是多少。可以想象,一個好的檢測方法,基檢測值應該很緊密的分散在真實值周圍。如何不緊密,那距真實值的就會大,準确性當然也就不好了,不可能想象離散度大的方法,會測出準确的結果。因此,離散度是評價方法的好壞的最重要也是最基本的指标。

一組數據怎樣去評價和量化它的離散度呢?人們使用了很多種方法:

    極差

最直接也是最簡單的方法,即最大值-最小值(也就是極差)來評價一組數據的離散度。這一方法在日常生活中最為常見,比如比賽中去掉最高最低分就是極差的具體應用。

2.離均差的平方和

由于誤差的不可控性,因此隻由兩個數據來評判一組數據是不科學的。所以人們在要求更高的領域不使用極差來評判。其實,離散度就是數據偏離平均值的程度。因此将數據與均值之差(我們叫它離均差)加起來就能反映出一個準确的離散程度。和越大離散度也就越大。

但是由于偶然誤差是成正态分布的,離均差有正有負,對于大樣本離均差的代數和為零的。為了避免正負問題,在數學有上有兩種方法:一種是取絕對值,也就是常說的離均差絕對值之和。而為了避免符号問題,數學上最常用的是另一種方法--平方,這樣就都成了非負數。因此,離均差的平方和成了評價離散度一個指标。

3.方差(S2)由于離均差的平方和與樣本個數有關,隻能反應相同樣本的離散度,而實際工作中做比較很難做到相同的樣本,因此為了消除樣本個數的影響,增加可比性,将标準差求平均值,這就是我們所說的方差成了評價離散度的較好指标。

我們知道,樣本量越大越能反映真實的情況,而算數均值卻完全忽略了這個問題,對此統計學上早有考慮,在統計學中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當選到隻剩一個時,它不可能再有自由了,所以自由度是n-1。

4.标準差(SD)由于方差是數據的平方,與檢測值本身相差太大,人們難以直觀的衡量,所以常用方差開根号換算回來這就是我們要說的标準差。

在統計學中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當選到隻剩一個時,它不可能再有自由了,所以自由度是n-1。

5.變異系數(CV)标準差能很客觀準确的反映一組數據的離散程度,但是對于不同的檢目,或同一項目不同的樣本,标準差就缺乏可比性了,因此對于方法學評價來說又引入了變異系數CV。

與平均值的關系

标準差與平均值的關系

一組數據的平均值及标準差常常同時做為參考的依據。在直覺上,如果數值的中心以平均值來考慮,則标準差為統計分布之一"自然"的測量。較确切的叙述為:假設x1,...,xn為實數,定義其公式

使用微積分,不難算出σ(r)在下面情況下具有唯一最小值。

應用舉例

标準差是方差的算術平方根

标準差能反映一個數據集的離散程度。平均數相同的,标準差未必相同。

例如,A、B兩組各有6位學生參加同一次語文測驗,A組的分數為95、85、75、65、55、45,B組的分數為73、72、71、69、68、67。這兩組的平均數都是70,但A組的标準差為17.08分,B組的标準差為2.16分,說明A組學生之間的差距要比B組學生之間的差距大得多。

與标準偏差區别

标準偏差與标準差的區别

标準差(Standard Deviation)各數據偏離平均數的距離(離均差)的平均數,它是離差平方和平均後的方根。用σ表示。因此,标準差也是一種平均數。标準差是方差的算術平方根。

标準差能反映一個數據集的離散程度。平均數相同的,标準差未必相同。

例如,A、B兩組各有6位學生參加同一次語文測驗,A組的分數為95、85、75、65、55、45,B組的分數為73、72、71、69、68、67。這兩組的平均數都是70,但A組的标準差為17.08分,B組的标準差為2.16分,說明A組學生之間的差距要比B組學生之間的差距大得多。

标準偏差(Std Dev,Standard Deviation)-統計學名詞。一種量度數據分布的分散程度之标準,用以衡量數據值偏離算術平均值的程度。标準偏差越小,這些值偏離平均值就越少,反之亦然。标準偏差的大小可通過标準偏差與平均值的倍率關系來衡量。

應用實例

選基金

在投資基金上,一般人比較重視的是業績,但往往買進了近期業績表現最佳的基金之後,基金表現反而不如預期,這是因為所選基金波動度太大,沒有穩定的表現。

衡量基金波動程度的工具就是标準差(Standard Deviation)。标準差是指基金可能的變動程度。标準差越大,基金未來淨值可能變動的程度就越大,穩定度就越小,風險就越高。

比方說,一年期标準差是30%的基金,表示這類基金的淨值在一年内可能上漲30%,但也可能下跌30%。因此,如果有兩隻收益率相同的基金,投資人應該選擇标準差較小的基金(承受較小的風險得到相同的收益),如果有兩隻相同标準差的基金,則應該選擇收益較高的基金(承受相同的風險,但是收益更高)。

建議投資人同時将收益和風險計入,以此來判斷基金。例如,A基金二年期的收益率為36%,标準差為18%;B基金二年期收益率為24%,标準差為8%,從數據上看,A基金的收益高于B基金,但同時風險也大于B基金。A基金的"每單位風險收益率"為2(0.36/0.18),而B基金為3(0.24/0.08)。因此,原先僅僅以收益評價是A基金較優,但是經過标準差即風險因素調整後,B基金反而更為優異。

另外,标準差也可以用來判斷基金屬性。據晨星統計,今年以來股票基金的平均标準差為5.14,積配型基金的平均标準差為5.04;保守配置型基金的平均标準差為4.86;普通債券基金平均标準差為2.91;貨币基金平均标準差則為0.19;由此可見,越是積極型的基金,标準差越大;而如果投資人持有的基金标準差高于平均值,則表示風險較高,投資人不妨在觀賞奧運比賽的同時,也檢視一下手中的基金。

企業中的應用

資本結構指的是企業各種資金來源的比例關系,是企業籌資活動的結果。最優資本結構是指能使企業資本成本最低且企業價值最大的資本結構;産權比率,即借入資本與自有資本的構成比例,是反映企業資本結構的重要變量。企業的資産由債務性資金和權益性資金組成,但其風險等級和收益率各不相同。

根據投資組合理論,投資的多樣化可以分散掉一定的風險,因此資金提供者需要決定投資于債務性資金和權益性資金的比例。以便在權衡風險和收益的情況下保證其利益的最大化。理論探索而外部資金提供者利益的最大化也就是企業價值的最大化,這一投資比例對于企業融資而言也就是企業的最優資本結構比例。

假定某企業的資金通過發行債券和股票兩種方式獲得,并且都屬于風險性資産。σ其中債券的收益率為rD,風險通過标準差σD來衡量;股票的收益率為rE,風險為σE;股票和債券的相關系數為pDE,協方差為COV(rD,rE);債券所占的比重為wD,股票所占比重為WE(WD+WE=1)。根據投資組合理論,企業外部投資者對該企業投資所獲的期望收益率為E(rp) =WDE(rD) +wEE(rE),方差為

1、企業債務性資金和權益性資金完全正相關,即相關系數pDE為1。企業外部投資者獲得的期望收益率為E(rp)=wDE(rD)+wEE(rE),風險标準差為σ=wDσD+wEσE,也就是組合的标準差等于各個部分标準差的加權平均值,通過投資組合不可能分散掉投資風險。根據投資組合理論,投資組合的不同比例對于投資者而言是無差異的。

2、企業債務性資金和權益性資金完全負相關,即其相關系數為-1。投資者獲得的報酬率的期望值及其方差分别為。根據投資組合理論,隻有當投資比例大于σE/(σD+σE)時其投資組合才是有效的。對于企業籌資而言,也即企業的權益性資金的比例大幹σE/(σD+σE),企業的籌資比例才是有效的,而且當組合比例為σE/(σD+σE)時,企業的籌資組合風險為零。

⒊、企業債務性資金和權益性資金的相關系數大于-1小于1。理論上,一個企業的兩種籌資方式之間的相關程度較高,一方面兩種籌資方式都承擔系統風險,另一方面它們也承擔相同的公司風險。因此從實踐來看,企業的不同籌資方式間的相關程度不可能是完全的正相關和負相關。對于一個企業而言,債務性資金對企業有固定的要求權,權益性資金對企業隻有剩餘要求權,因此債務性資金的波動不可能像權益性資金的波動那麼大。同時企業的風險會同時影響企業的債務性資金和權益性資金,因此企業的債務性資金和權益性資金的相關系數不可能為負數。企業不同的籌資方式間的相關系數一般在0-1之間。

那麼究竟在什麼比例下企業的價值才會達到最大呢?根據投資組合理論,當E(r1)>E(r2),且時,才能出現r1,優于r2。可見,決定企業資本結構的直接因素主要是不同籌資方式的收益率和風險以及它們之間的相關系數。

相關詞條

相關搜索

其它詞條