zoukankan      html  css  js  c++  java
  • 关系抽取 --- 远程监督--- Relation Extraction with Multi-instance Multi-label Convolutional Neural Networks

    这篇文章从另一个角度来解决Zeng 2015的问题,并且考虑了实体对的多关系的问题。

    动机

    • Zeng 2015里面仅仅取置信度最高的instance,丢失信息。
    • 在数据集中,有约18.3%的entity pair有多种relation, 其他方法均未考虑。

    模型

    针对以上的两个问题提出了两个解决方法:

    • 对bag内部的所有sentence embeding做instance-max-pooling的操作,具体细节后面介绍
    • 对于多标签,使用多个二分类函数来做多标签分类,即: 使用sigmod计算每一个类别的概率, 然后判断该bag是否可能有这种关系。

    模型的结构如图:

    输入也是一个bag,然后利用CNN/PCNN来计算每个sentence的embedding,之后的融合方式很直接,直接对embedding的每一维度取所有sentence的对应维度的最大值。

    其中k表示embedding的某一维度,jj表示bag中的第j个句子。 这样就可以融合所有sentence的信息了。后面加一个全连接层计算每一个类别的score:

    之后不再是加softmax多分类了,而是使用sigmod函数计算每个relation的概率,然后超过某个阈值,就认为该relation是准确的:

    其中ll就是类别的总数。 文中设计了两种损失函数来做对比, Sigmod Loss Vs Squared Loss:

    实验 直接看P-R Curve结果,相比PCNN提升比较明显:

    再看取max的设计的作用,与直接取平均对比, 这里有点需要说明,在这个实验中,取平均要比PCNN效果好,而在上一篇平均效果差, 这说明的是multi label有提升的作用:

    最后一个是两种损失函数的对比:

    可以看出,二者在不同的区域各自有优势。

    总结

    仅仅对bags内的sentence的每一维度取了最大值,就可以得到一个很不错的效果, 可以考虑其他稍微复杂一些的融合方式,从而得到更多的信息,Attention仅仅取权重,其实还是属于线性融合。此外这篇文章仍然也是在该CNN/PCNN基础上进行扩展,从这一点来说创新性有些少。 不过文中提出的Multi Label 则是一个新的方向.

  • 相关阅读:
    开源项目
    ASP.NET上传文件带有真实的进度条
    VS2010不能调试的问题
    sql server 2005中获取数据库个数
    【转载】Nios II DMA: memory to memory
    【转】我们为什么要实习
    【转】应聘时最漂亮的回答
    【转】面试建议 每个要找工作的童鞋必看~
    【转载】FPGA Verilog HDL 系列实例 电子琴 电子钟
    【转】关于工作与生活 HP大中华区总裁孙振耀的退休感言
  • 原文地址:https://www.cnblogs.com/dhName/p/11751799.html
Copyright © 2011-2022 走看看