定義
極差是指總體各單位的标志值中,最大标志值與最小标志值之差。它是标志值變動的最大範圍。極差也稱為全距或範圍誤差,它是測定标志變動的最簡單的指标。換句話說,也就是指一組數據中的最大數據與最小數據的差叫做這組數據的極差。極差英文為range,簡寫為R,表示為:R=Xmax-Xmin。移動極差(Moving Range)是其中的一種。
計算公式
全距=最大标志值—最小标志值
R=Xmax-Xmin
(其中,Xmax為最大值,Xmin為最小值)
例如:12、12、13、14、16、21
這組數的極差就是:21-12=9
例如,“早穿皮襖午穿紗”,這句話說明的氣溫特征數就是極差。
方差計算公式:s^2=(1/n)*[(x1-x0)^2(x2-x0)^2+...+(xn-x0)^2]
(X0即為x的平均值)
移動極差
移動極差(Moving Range),是指兩個或多個連續樣本值中最大值與最小值之差,這種差是按這樣方式計算的:每當得到一個額外的數據點時,就在樣本中加上這個新的點,同時删除其中時間上“最老的”點,然後計算與這點有關的極差,因此每個極差的計算至少與前一個極差的計算共用一個點的值。一般說來,移動極差用于單值控制圖,并且通常用兩點(連續的點)來計算移動極差。
極差計算示例
求下列數字集的極差
65、81、73、85、94、79、67、83、82
極差指的是這些數字分開得有多遠,計算方法是:用其中最大的數減去最小的數
首先找其中最大的數,65、81、73、85、94、79、67、83、82
最大數是94,94比其他數都大,所以它是這些數字中最大的。然後要減去這些數字中最小的。該數字集中最小的數字是65。
那麼極差是:
94−65
算一算
94−65=29
這個數字越大,表示分得越開,最大數和最小數之間的差就越大,該數越小,數字鍵就越緊密,這就是極差的概念!
用途和意義
在統計中常用極差來刻畫一組數據的離散程度,以及反映的是變量分布的變異範圍和離散幅度,在總體中任何兩個單位的标準值之差都不能超過極差。同時,它能體現一組數據波動的範圍。極差越大,離散程度越大,反之,離散程度越小。
極差隻指明了測定值的最大離散範圍,而未能利用全部測量值的信息,不能細緻地反映測量值彼此相符合的程度,極差是總體标準偏差的有偏估計值,當乘以校正系數之後,可以作為總體标準偏差的無偏估計值,它的優點是計算簡單,含義直觀,運用方便,故在數據統計處理中仍有着相當廣泛的應用。但是,它僅僅取決于兩個極端值的水平,不能反映其間的變量分布情況,同時易受極端值的影響。
極差
最直接也是最簡單的方法,即最大值-最小值(也就是極差)來評價一組數據的離散度。這一方法在日常生活中最為常見,比如比賽中去掉最高最低分就是極差的具體應用。
2.離均差的平方和
由于誤差的不可控性,因此隻由兩個數據來評判一組數據是不科學的。所以人們在要求更高的領域不使用極差來評判。其實,離散度就是數據偏離平均值的程度。因此将數據與均值之差(我們叫它離均差)加起來就能反映出一個準确的離散程度。和越大離散度也就越大。
但是由于偶然誤差是成正态分布的,離均差有正有負,對于大樣本離均差的代數和為零的。為了避免正負問題,在數學有上有兩種方法:一種是取絕對值,也就是常說的離均差絕對值之和。而為了避免符号問題,數學上最常用的是另一種方法--平方,這樣就都成了非負數。因此,離均差的平方和成了評價離散度一個指标。
3.方差(S2)
由于離均差的平方和與樣本個數有關,隻能反應相同樣本的離散度,而實際工作中做比較很難做到相同的樣本,因此為了消除樣本個數的影響,增加可比性,将離均差的平方和求平均值,這就是我們所說的方差成了評價離散度的較好指标。
我們知道,樣本量越大越能反映真實的情況,而算數均值卻完全忽略了這個問題,對此統計學上早有考慮,在統計學中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當選到隻剩一個時,它不可能再有自由了,所以自由度是n-1。
①離散程度的通俗解釋——波動大小,
②為什麼要研究一組數據的離散程度。
全面認識一組數據的兩個特征:
探索平均數的代表性。
實際問題的需要。
③探索如何表示一組數據的離散程度——方差的形
成過程。
首先,極差——比較粗略;
其次,平均差,比極差更全面,不常用;
再次,選擇方差,但數值的單位與原數據單位不
一緻。
最後,常用标準差。δ=S2
④統計含義的解釋——方差全面地平均地反映,
标準差全面地直接地反映。
偏離平均數——指與平均數的離差。
平均的——指離差的平均數的平均值。
全面的——指考慮了每個數據的離差。
直接的——指數值單位與原數據單位一緻。
⑤應用條件——平均數相同。特殊情況,平均數相
差很小、近似相等時也可以用,不
受兩組數據個數的差異限制。
⑥實際作用:
1°直接比較:
同一時間事物或現象的整齊性、均勻性、一緻性的差異;
不同時間過程的穩定性、均衡性、一緻性的差異;
2°比較平均數的代表性:
3°與平均數配合作統計分析:如:Vδ=
4°樣本估計總體。樣本比較估計總體的差異,用樣本
标準差,估計總體标準差。
*樣本估計總體的方法有兩個:點估計和區間估計。
隻要求會點估計,即直接用樣本的特征數作為總體
相應參數的估計值。
4.标準差(SD)
由于方差是數據的平方,與檢測值本身相差太大,人們難以直觀的衡量,所以常用方差開根号換算回來這就是我們要說的标準差。
5.變異系數(CV)
标準差能很客觀準确的反映一組數據的離散程度,但是對于不同的項目,或同一項目不同的樣本,标準差就缺乏可比性了,因此對于方法學評價來說又引入了變異系數CV。
不過日常的質控工作檢測的都是同一質控物所以有标準差就足以反應了,同時質控的目的是發現有沒有實驗錯誤,要設制警報線,并不是要評價檢測方法,所以隻可能使用标準差,而不用變異系數。
頻數分布:
①頻數的通俗解釋:頻數出現的次數,小組裡數據的個
數。
②數據的分組整理——分三個步驟:
一是确實分組的方法,先分組,這是整理的難點,分
組的方法,根據需要确定。分組的方法确定《課
标》不作要求。
二是累計各小組的頻數,并計算相應的頻率,用頻數
分布表表示整理的結果。
三是根據頻數分布表畫出頻數分布直方圖。
③觀察頻數分布表和分布圖,獲得數據分布的信息和分布
特征。
1°數據分布最多,最集中(衆數組)和最少的小組;
2°數據分布(頻數)的變化趨勢與分布狀态;
3°中位數和平均數在哪個小組,是否是偏态分布;
4°獲取所需要的其他數據信息。