數學期望

數學期望

數學領域術語
在概率論和統計學中,數學期望(mean)(或均值,亦簡稱期望)是試驗中每次可能結果的概率乘以其結果的總和,是最基本的數學特征之一。它反映随機變量平均取值的大小。需要注意的是,期望值并不一定等同于常識中的“期望”——“期望值”也許與每一個結果都不相等。期望值是該變量輸出值的平均數。期望值并不一定包含于變量的輸出值集合裡。大數定律表明,随着重複次數接近無窮大,數值的算術平均值幾乎肯定地收斂于期望值。
    中文名:數學期望 外文名:expectation 适用領域:數學統計、數據挖掘 所屬學科:數學 性質:該變量輸出值的平均數 别名:均值,期望

曆史故事

在17世紀,有一個賭徒向法國著名數學家帕斯卡挑戰,給他出了一道題目:甲乙兩個人賭博,他們兩人獲勝的機率相等,比賽規則是先勝三局者為赢家,一共進行五局,赢家可以獲得100法郎的獎勵。當比賽進行到第四局的時候,甲勝了兩局,乙勝了一局,這時由于某些原因中止了比賽,那麼如何分配這100法郎才比較公平?

用概率論的知識,不難得知,甲獲勝的可能性大,乙獲勝的可能性小。

因為甲輸掉後兩局的可能性隻有(1/2)×(1/2)=1/4,也就是說甲赢得後兩局或後兩局中任意赢一局的概率為1-(1/4)=3/4,甲有75%的期望獲得100法郎;而乙期望赢得100法郎就得在後兩局均擊敗甲,乙連續赢得後兩局的概率為(1/2)*(1/2)=1/4,即乙有25%的期望獲得100法郎獎金。

可見,雖然不能再進行比賽,但依據上述可能性推斷,甲乙雙方最終勝利的客觀期望分别為75%和25%,因此甲應分得獎金的100*75%=75(法郎),乙應分得獎金的的100×25%=25(法郎)。這個故事裡出現了“期望”這個詞,數學期望由此而來。

離散型

如果随機變量隻取得有限個值或無窮能按一定次序一一列出,其值域為一個或若幹個有限或無限區間,這樣的随機變量稱為離散型随機變量。

離散型随機變量的一切可能的取值與對應的概率乘積之和稱為該離散型随機變量的數學期望(若該求和絕對收斂),記為。它是簡單算術平均的一種推廣,類似加權平均。

公式

例子

某城市有10萬個家庭,沒有孩子的家庭有1000個,有一個孩子的家庭有9萬個,有兩個孩子的家庭有6000個,有3個孩子的家庭有3000個。

則此城市中任一個家庭中孩子的數目是一個随機變量,記為X。它可取值0,1,2,3。

其中,X取0的概率為0.01,取1的概率為0.9,取2的概率為0.06,取3的概率為0.03。

則,它的數學期望,即此城市一個家庭平均有小孩1.11個,當然人不可能用1.11個來算,約等于2個。

設Y是随機變量X的函數:(是連續函數)

連續型

設連續性随機變量X的概率密度函數為f(x),若積分絕對收斂,則稱積分的值為随機變量的數學期望,記為E(X)。

若随機變量X的分布函數F(x)可表示成一個非負可積函數f(x)的積分,則稱X為連續性随機變量,f(x)稱為X的概率密度函數(分布密度函數)。

數學期望完全由随機變量X的概率分布所确定。若X服從某一分布,也稱是這一分布的數學期望。

定理

若随機變量Y符合函數,且絕對收斂,則有:

該定理的意義在于:我們求時不需要算出Y的分布律或者概率分布,隻要利用X的分布律或概率密度即可。

上述定理還可以推廣到兩個或以上随機變量的函數情況。

設Z是随機變量X、Y的函數(g是連續函數),Z是一個一維随機變量,二維随機變量(X,Y)的概率密度為,則有:

區别

離散型随機變量與連續型随機變量都是由随機變量取值範圍(取值)确定。

變量取值隻能取離散型的自然數,就是離散型随機變量。例如,一次擲20個硬币,k個硬币正面朝上,k是随機變量。k的取值隻能是自然數0,1,2,…,20,而不能取小數3.5、無理數,因而k是離散型随機變量。

如果變量可以在某個區間内取任一實數,即變量的取值可以是連續的,這随機變量就稱為連續型随機變量。例如,公共汽車每15分鐘一班,某人在站台等車時間x是個随機變量,x的取值範圍是[0,15),它是一個區間,從理論上說在這個區間内可取任一實數3.5、無理數等,因而稱這随機變量是連續型随機變量。

性質

設C為一個常數,X和Y是兩個随機變量。以下是數學期望的重要性質:

性質3和性質4可以推到到任意有限個相互獨立的随機變量之和或之積的情況。

證明:

這裡隻對連續性随機變量的情況加以證明,對離散型的證明隻要将證明中的積分改為和式即可。

應用

經濟決策

假設某一超市出售的某種商品,每周的需求量X在10至30範圍内等可能取值,該商品的進貨量也在10至30範圍内等可能取值(每周隻進一次貨)超市每銷售一單位商品可獲利500元,若供大于求,則削價處理,每處理一單位商品虧損100元;若供不應求,可從其他超市調撥,此時超市商品可獲利300元。試計算進貨量多少時,超市可獲得最佳利潤?并求出最大利潤的期望值。

分析:由于該商品的需求量(銷售量)X是一個随機變量,它在區間[10,30]上均勻分布,而銷售該商品的利潤值Y也是随機變量,它是X的函數,稱為随機變量的函數。題中所涉及的最佳利潤隻能是利潤的數學期望(即平均利潤的最大值)。因此,本問題的解算過程是先确定Y與X的函數關系,再求出Y的期望E(Y)。最後利用極值法求出E(Y)的極大值點及最大值。

抽獎問題

假設某百貨超市現有一批快到期的日用産品急需處理,超市老闆設計了免費抽獎活動來處理掉了這些商品。紙箱中裝有大小相同的20個球,10個10分,10個5分,從中摸出10個球,摸出的10個球的分數之和即為中獎分數,獲獎如下:

一等獎100分,冰櫃一個,價值2500元;

二等獎50分,電視機一個,價值1000元;

三等獎95分,洗發液8瓶,價值178元;

四等獎55分,洗發液4瓶,價值88元;

五等獎60分,洗發液2瓶,價值44元;

六等獎65分,牙膏一盒,價值8元;

七等獎70分,洗衣粉一袋,價值5元;

八等獎85分,香皂一塊,價值3元;

九等獎90分,牙刷一把,價值2元;

十等獎75分與80分為優惠獎,隻収成本價22元,将獲得洗發液一瓶;

分析:表面上看整個活動對顧客都是有利的,一等獎到九等獎都是白得的,隻有十等獎才收取一點成本價。但經過分析可以知道商家真的就虧損了嗎?顧客就真能從中獲得抽取大獎的機會嗎?求得其期望值便可真相大白。摸出10個球的分值隻有11種情況,用X表示摸獎者獲得的獎勵金額數,計算得到E(X)=-10.098,表明商家在平均每一次的抽獎中将獲得10.098元,而平均每個抽獎者将花10.098元來享受這種免費的抽獎。從而可以看出顧客真的就占到大便宜了嗎?相反,商家采用這種方法不僅把快要到期的商品處理出去了,而且還為超市大量集聚了人氣,一舉多得。此百貨超市老闆運用數學期望估計出了他不會虧損而做了這個免費抽獎活動,最後一舉多得,從中可看出了數學期望這一科學的方法在經濟決策中的重要性。

體育比賽問題

乒乓球是我們的國球,上世紀兵兵球也為中國帶了一些外交。中國隊在這項運動中具有絕對的優勢。現就乒乓球比賽的安排提出一個問題:假設德國隊(德國隊名将波爾在中國也有很多球迷)和中國隊比賽。賽制有兩種,一種是雙方各出3人,三場兩勝制,一種是雙方各出5人,五場三勝制,哪一種賽制對中國隊更有利?

分析:由于中國隊在這項比賽中的優勢,不妨設中國隊中每一位隊員德國隊員的勝率都為60%,接着隻需要比較兩個隊對應的數學期望即可。

相關詞條

相關搜索

其它詞條