zoukankan      html  css  js  c++  java
  • 关系抽取 --- 远程监督 ---《DIAG-NRE: A Neural Pattern Diagnosis Framework for Distantly Supervised Neural Relation Extraction》

    • 概述

        为了减轻pattern编写的工作量,并能够对新的关系类型进行快速泛化,作者提出了一种 pattern诊断框架DIAG-NRE,该框架能够在人工专家的参与下,从噪声数据中自动总结和提炼高质量的关系模式

    • 主要结构图:

        

      • NRE Models
        对于一个instance  s, token成  [x1,x2,x3...xT].用X表示。每个xi都是有word emdbedding 和 position embedding 串联组成。
        给定一个关系r, NRE model的作用就是 求出  .其中X为一个句子的表示,r为关系,为模型的参数。
      •  Pattern Extraction

        Action.
          动作是针对每一位的token采取保留还是去除(保留为0,去除为1)的操作。因为token xi是由word embidding和position embeding组成,只对word进行操作。
          在进行了一系列的操作之后,a=(a1,a2,a3,a4) .  X->X'   T->T'
        Rward:
          我们的目的是找到最简单的序列X'来保持原始预测的可信度。
          
          左边是对数似然项,以追求较高的预测置信度; 另一个是稀疏比项,以诱导保留token的稀疏性

        State:
          agent的state应该独立于NRE model的state;
          agent的初始状态和NRE一样是X
         Agent
          
           agent 以非自回归的方式  进行计算
          在决定每个token的操作时,丰富上下文信息,,文章采用了BiLSTM进行了编码。
          

          h为LSTM的隐藏层的个数
          
        Optimization:
          

        Pattern Induction
          之后,给定instances和actions,我们这样来产生pattern:
          ①相应的实体类型替换原始实体对
          ②通过agent来获得tokens和相对位置
          ③然后把剩余的token的相对位置进行进行归纳到4个情况:zero(两个token见中间没有被抹除的token),short(1-3tokens),  medium(4-9 tokens),  long (10 or more tokens)



      • Pattern Refinement (未完待续)




      • Weak Label Fusion (未完待续)



  • 相关阅读:
    you have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'varchar(255), sort integer not null
    mysql导出数据到excel的两种方式
    java8 foreach不能使用break、countinue
    学习rabbitmq
    shell脚本基础
    编程基础;程序的执行方式;编程基本概念
    定制vim的工作特性
    使用多个“窗口”
    多文件模式
    可视化模式
  • 原文地址:https://www.cnblogs.com/dhName/p/11821085.html
Copyright © 2011-2022 走看看