CRF算法

CRF算法

數學算法
CRF算法:中文名稱條件随機場算法,外文名稱conditional random field algorithm,是一種數學算法,是2001年提出的,基于遵循馬爾可夫性的概率圖模型。[1]
  • 中文名:條件随機場算法
  • 外文名:conditional random field algorithm
  • 适用領域:
  • 所屬學科:
  • 提出時間:2001年
  • 原理:隐馬爾可夫模型

應用

條件随機場(CRF)由Lafferty等人于2001年提出,結合了最大熵模型和隐馬爾可夫模型的特點,是一種無向圖模型,近年來在分詞、詞性标注和命名實體識别等序列标注任務中取得了很好的效果。條件随機場是一個典型的判别式模型,其聯合概率可以寫成若幹勢函數聯乘的形式,其中最常用的是線性鍊條件随機場。若讓x=(x1,x2,…xn)表示被觀察的輸入數據序列,y=(y1,y2,…yn)表示一個狀态序列,在給定一個輸入序列的情況下,線性鍊的CRF模型定義狀态序列的聯合條件概率

p(y|x)=exp{}(2-14)

Z(x)={}(2-15)

其中:Z是以觀察序列x為條件的概率歸一化因子;fj(yi-1,yi,x,i)是一個任意的特征函數;是每個特征函數的權值。

基本元素

HMM中,有5個基本元素:{I,O,A,B,π},我結合序列标志任務對這5個基本元素做一個介紹:

(1)I:狀态序列。在這裡,是指每一個詞語背後的标注。

(2)O:觀測序列。在這裡,是指每一個詞語本身。

(3)A:轉移特征函數(狀态轉移概率矩陣):λktk(yi−1,yi,x,i),k為特征個數

(4)B:狀态特征函數(觀測概率矩陣):ulsl(yi,x,i),l為特征個數

相關詞條

相關搜索

其它詞條