應用
條件随機場(CRF)由Lafferty等人于2001年提出,結合了最大熵模型和隐馬爾可夫模型的特點,是一種無向圖模型,近年來在分詞、詞性标注和命名實體識别等序列标注任務中取得了很好的效果。條件随機場是一個典型的判别式模型,其聯合概率可以寫成若幹勢函數聯乘的形式,其中最常用的是線性鍊條件随機場。若讓x=(x1,x2,…xn)表示被觀察的輸入數據序列,y=(y1,y2,…yn)表示一個狀态序列,在給定一個輸入序列的情況下,線性鍊的CRF模型定義狀态序列的聯合條件概率為
Z(x)={}(2-15)
其中:Z是以觀察序列x為條件的概率歸一化因子;fj(yi-1,yi,x,i)是一個任意的特征函數;是每個特征函數的權值。
基本元素
HMM中,有5個基本元素:{I,O,A,B,π},我結合序列标志任務對這5個基本元素做一個介紹:
(1)I:狀态序列。在這裡,是指每一個詞語背後的标注。
(2)O:觀測序列。在這裡,是指每一個詞語本身。
(3)A:轉移特征函數(狀态轉移概率矩陣):λktk(yi−1,yi,x,i),k為特征個數
(4)B:狀态特征函數(觀測概率矩陣):ulsl(yi,x,i),l為特征個數