數理統計

數理統計

數學名詞
數理統計是以概率論為基礎,研究社會和自然界中大量随機現象數量變化基本規律的一種方法。它以随機現象的觀察試驗取得資料作為出發點,以概率論為理論基礎來研究随機現象。根據資料為随機現象選擇數學模型,且利用數學資料來驗證數學模型是否合适,在合适的基礎上再研究它的特點、性質和規律性。數理統計是伴随着概率論的發展而發展起來的一個數學分支,研究如何有效的由集、整理和分析受随機因素影響的數據,并對所考慮的問題作出推斷或預測,為采取某種決策和行動提供依據或建議。
    中文名:數理統計 外文名:mathematical statistics 所屬學科: 基礎:概率論 主要内容:等參數估計、假設檢驗 性 質:樣本及抽樣分布 應 用:數學

起源發展

數理統計是伴随着概率論的發展而發展起來的一個數學分支,研究如何有效的收集、整理和分析受随機因素影響的數據,并對所考慮的問題作出推斷或預測,為采取某種決策和行動提供依據或建議。

數理統計起源于人口統計、社會調查等各種描述性統計活動.公元前2250年,大禹治水,根據山川土質,人力和物力的多寡,分全國為九州;殷周時代實行井田制,按人口分地,進行了土地與戶口的統計;春秋時代常以兵車多寡論諸侯實力,可見已進行了軍事調查和比較;漢代全國戶口與年齡的統計數字有據可查;明初編制了黃冊與魚鱗冊,黃冊乃全國戶口名冊,魚鱗冊系全國土地圖籍,繪有地形,完全具有現代統計圖表的性質。可見,我國曆代對統計工作非常重視,隻是缺少系統研究,未形成專門的著作。

在西方各國,統計工作開始于公元前3050年,埃及建造金字塔,為征收建築費用,對全國人口進行普查和統計,到了亞裡士多德時代,統計工作開始往理性演變。這時,統計在衛生、保險、國内外貿易、軍事和行政管理方面的應用,都有詳細的記載,統計一詞,就是從意大利一詞逐步演變而成的。

數理統計的發展大緻可分為古典時期、近代時期和現代時期三個階段。

古典時期

(19世紀以前)

這是描述性的統計學形成和發展階段,是數理統計的萌芽時期。在這一時期裡,瑞士數學家伯努利(1654-1705年)較早地系統論證了大數定律。1763年,英國數學家貝葉斯提出了一種歸納推理的理論,後被發展為一種統計推斷方法――貝葉斯方法,開創了數理統計的先河。法國數學家棣莫佛(1667-1754)于1733年首次發現了正态分布的密度函數,并計算出該曲線在各種不同區間内的概率,為整個大樣本理 論奠定了基礎。1809年,德國數學家高斯(1777-1855)和法國數學家勒讓德(1752-1833)各自獨立地發現了最小二乘法,并應用于觀測數據的誤差分析,在數理統計的理論與應用方面都作出了重要貢獻,他不僅将數理統計應用到生物學,而且還應用到教育學和心理學的研究,并且詳細地論證了數理統計應用的廣泛性,他曾預言:"統計方法,可應用于各種學科的各個部門" 。

近代時期

(19世紀末至1945年)

數理統計的主要分支建立,是數理統計的形成時期.上一世紀初,由于概率論的發展從理論上接近完備,加之工農業生産迫切需要,推動着這門學科的蓬勃發展。

1889年,英國數學家皮爾遜(1857-1936)提出了矩估計法,次年又提出了頻率曲線的理論.并于1900年在德國數學家赫爾梅特在發現 c 2分布的基礎上提出了c 2 檢驗,這是數理統計發展史上出現的第一個小樣本分布。

1908年,英國的統計學家戈塞特(1876-1937)創立了小樣本檢驗代替了大樣本檢驗的理論和方法(即t分布和t檢驗法),這為數理統計的另一分支――多元分析奠定理論基礎。

1912年,英國統計學家費歇(1890-1962)推廣了t檢驗法,同時發展了顯著性檢驗及估計和方差分析等數理統計新分支。

這樣,數理統計的一些重要分支如假設檢驗、回歸分析、方差分析、正交設計等有了其決定其面貌的内容和理論。數理統計成為應用廣泛、方法獨特的一門數學學科。 

現代時期

(1945年以後)

美籍羅馬尼亞數理統計學家瓦你德(1902-1950)緻力于用數學方法使統計學精确化、嚴密化,取得了很多重要成果.他發展了決策理論,提出了一般的判别問題,創立了序貫分析理論,提出著名的序貫概率比檢法.瓦爾德的兩本著作《序貫分析》和《統計決策函數論》,被認為是數理發展史上的經典之作。

由于計算機的應用,推動了數理統計在理論研究和應用方面不斷地向縱深發展,并産生一些新的分支和邊緣性的新學科,如最優設計和非參數統計推斷等。

當前,數理統計的應用範圍愈來愈廣泛,已滲透到許多科學領域,應用到國民經濟各個部門,成為科學研究不可缺少的工具。 

簡介

定義

數理統計是以概率論為基礎,研究社會和自然界中大量随機現象數量變化基本規律的一種方法。其主要内容有參數估計、假設檢驗、相關分析、試驗設計、非參數統計、過程統計等。

特點

它以随機現象的觀察試驗取得資料作為出發點,以概率論為理論基礎來研究随機現象,根據資料為随機現象選擇數學模型,且利用數學資料來驗證數學模型是否合适,在合适的基礎上再研究它的特點,性質和規律性。

例如燈泡廠生産燈泡,将某天的産品中抽出幾個進行試驗,試驗前不知道該天燈泡的壽命有多長,概率和其分布情況。試驗後得到這幾個燈泡的壽命作為資料,從中推測整批生産燈泡的使用壽命、合格率等。為了研究它的分布,利用概率論提供的數學模型進行指數分布,求出值,再利用幾天的抽樣試驗來确定指數分布的合适性。

統計工作諸環節

用數理統計方法去解決一個實際問題時,一般有如下幾個步驟 :建立數學模型,收集整理數據,進行統計推斷、預測和決策。這些環節不能截然分開,也不一定按上述次序,有時是互相交錯的。

①模型的選擇和建立。在數理統計學中,模型是指關于所研究總體的某種假定,一般是給總體分布規定一定的類型。建立模型要依據概率的知識、所研究問題的專業知識、以往的經驗以及從總體中抽取的樣本(數據)。

②數據的收集。有全面觀測、抽樣觀測和安排特定的實驗3種方式。全面觀測又稱普查,即對總體中每個個體都加以觀測,測定所需要的指标。抽樣觀測又稱抽查,是指從總體中抽取一部分,測定其有關的指标值。這方面的研究内容構成數理統計的一個分支學科。叫抽樣調查。

③安排特定實驗以收集數據,這些特定的實驗要有代表性,并使所得數據便于進行分析。這裡面所包含的數學問題,構成數理統計學的又一分支學科,即實驗設計的内容。

④數據整理。目的是把包含在數據中的有用信息提取出來 。 一種形式是制定适當的圖表,如散點圖,以反映隐含在數據中的粗略的規律性或一般趨勢。另一種形式是計算若幹數字特征,以刻畫樣本某些方面的性質,如樣本均值、樣本方差等簡單描述性統計量。

⑤統計推斷。指根據總體模型以及由總體中抽出的樣本,作出有關總體分布的某種論斷 。數據的收集和整理是進行統計推斷的必要準備,統計推斷是數理統計學的主要任務。

⑥統計預測。統計預測的對象,是随機變量在未來某個時刻所取的值,或設想在某種條件下對該變量進行觀測時将取的值。例如,預測一種産品在未來3年内的市場銷售量,某個10歲男孩在3年後的身高,體重等等。

⑦統計決策。依據所做的統計推斷或預測,并考慮到行動的後果(以經濟損失的形式表示)而制定的一種行動方案。目的是使損失盡可能小,或反過來說,使收益盡可能大。例如,一個商店要決定今年内某種産品的進貨數量,商店的統計學家根據抽樣調查,預測該産品本店今年銷售量為1000件。假定每積壓一件産品損失20元,而少銷售一件産品則損失10元,要據此作出關于進貨數量的決策。

學科應用

數理統計在自然科學、工程技術、管理科學及人文社會科學中得到越來越廣泛和深刻的應用,其研究的内容也随着科學技術和政治、經濟與社會的不斷發展而逐步擴大,但概括地說可以分為兩大類:⑴試驗的設計和研究,即研究如何更合理更有效地獲得觀察資料的方法;⑵統計推斷,即研究如何利用一定的資料對所關心的問題作出盡可能精确可靠的結論,當然這兩部分内容有着密切的聯系,在實際應用中更應前後兼顧。但按本專業的總體設計,我們的數理統計課程隻讨論統計推斷。數理統計以概率論為基礎,根據試驗或觀察得到的數據,來研究随機現象統計規律性的學科。本課程的目的是讓學生了解統計推斷檢驗等方法并能夠應用這些方法對研究對象的客觀規律性作出種種合理的估計和判斷。掌握總體參數的點估計和區間估計。掌握假設檢驗的基本方法與技巧。理解平方差分析及回歸分析的原理,并能運用其方法和技巧進行統計推斷。

研究内容

數理統計方向的主要研究内容:抽樣調查、多元分析、序貫分析、回歸診斷、貝葉斯統計、模型選擇、機器學習、統計計算、非參數統計等。

相關詞條

相關搜索

其它詞條