转载

Relation Classification via Convolutional Deep Neural Network

Relation Classification via Convolutional Deep Neural Network

最近在学习关系抽取,找了一些经典的论文来看,写下一点自己的理解,方便自己以后查阅。

关系抽取

关系抽取规范点的定义就是,给定一个包含两个实体 e 1 e_1 e 2 e_2 的句子S, 识别两个实体之间的关系(关系一般预先给出)。按照机器学习的思路,关系抽取就是一个多分类问题。所以早期大多是用SVM、最大熵等统计学习方法,来

解决关系抽取的问题。近年来,深度学习方法也被引入关系抽取领域,并取得了很好的效果。

概述

Relation Classification via Convolutional Deep Neural Network是2014年的一篇经典论文,主要的思想

是通过卷积神经网络将提取到的 lexical level features 和 sentence level feature映射成高层次特征,

用于关系分类 ,论文中最亮眼的地方就是Position Features(位置特征)。方法的总体框架如下图

lexical level features

论文中共用5个词汇特征,如下表所示,包括实体1、实体2、实体1左右两边的word、实体2左右两边的word的

词嵌入,还有一个是WordNet的上位词

sentence level features

sentence level features 包括两部分,一部分是Word Features, 另一部分是Position Features

Word Features(WF)

简单来说,就是词嵌入,只不过为了适应卷积神经网络,每一个词用w个n维词向量表示(wxn).

这里的w是windows size的意思,比如God helps those who help themselves.

those就用<x2,x3,x4>表示x2、x3、x4分别表示those, who, help的词向量

Position Features(PF)

估计你一开始就会有问题,怎么知道两个实体的位置。这里的Position Features就是用来提取实体位置特征

具体的,比如还是上面那句话God helps those who help themselves.God、themselves是那两个实体

who距离God:3, 距离themselves:-2.论文中用两个维度相同的向量 d 1 d_1 d 2 d_2 来表示每个词分别到实体1、实体2的

距离特征。

句子特征的提取框架如下

引用

论文地址 https://aclweb.org/anthology/C14-1220

正文到此结束
本文目录