CRF算法

CRF算法

数学算法
CRF算法:中文名称条件随机场算法,外文名称conditional random field algorithm,是一种数学算法,是2001年提出的,基于遵循马尔可夫性的概率图模型。[1]
  • 中文名:条件随机场算法
  • 外文名:conditional random field algorithm
  • 适用领域:
  • 所属学科:
  • 提出时间:2001年
  • 原理:隐马尔可夫模型

应用

条件随机场(CRF)由Lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果。条件随机场是一个典型的判别式模型,其联合概率可以写成若干势函数联乘的形式,其中最常用的是线性链条件随机场。若让x=(x1,x2,…xn)表示被观察的输入数据序列,y=(y1,y2,…yn)表示一个状态序列,在给定一个输入序列的情况下,线性链的CRF模型定义状态序列的联合条件概率

p(y|x)=exp{}(2-14)

Z(x)={}(2-15)

其中:Z是以观察序列x为条件的概率归一化因子;fj(yi-1,yi,x,i)是一个任意的特征函数;是每个特征函数的权值。

基本元素

HMM中,有5个基本元素:{I,O,A,B,π},我结合序列标志任务对这5个基本元素做一个介绍:

(1)I:状态序列。在这里,是指每一个词语背后的标注。

(2)O:观测序列。在这里,是指每一个词语本身。

(3)A:转移特征函数(状态转移概率矩阵):λktk(yi−1,yi,x,i),k为特征个数

(4)B:状态特征函数(观测概率矩阵):ulsl(yi,x,i),l为特征个数

相关词条

相关搜索

其它词条