zoukankan      html  css  js  c++  java
  • 篇章语义+情感分析有感于bluejade师兄的EMNLP11论文

    最近两天拜读了bluejade师兄的论文"Unsupervised Discovery of Discourse Relation for Eliminating Intra-sentence Polarity Ambiguities"

    总体的思想是通过RST理论中的篇章关系(当然,师兄用的是句子级各句间的语义关系)来辅助句子级情感分析任务

    语义关系共有5大类

    • Contrast
    • Condition
    • Continuation
    • Cause
    • Purpose

    这5类是在对RST各关系在语料的统计分析基础上合并得到的,即这5类关系会影响到句子级的情感分析的效果。

    关系的抽取分为3步

    1. 构建初始模板。在RST理论基础上人工定义一些核心短语(cue phrases),并且这里是有 nucleus(n)和satellite(s)之分,即主次之分,模板的构造是考虑n和s之分的
    2. 从生语料中通过事先定义的模板来抽取关系实例,再将实例转化为SSRs(Semantic Sequential representations)表述形式,个人理解这就是对实例->模板的泛化过程。
    3. 最后,通过无指导的SSRs学习器对新的SSRs进行赋权和过滤,以得到高质量的SSRs。

    对于一个有歧义的句子(在文中是指既有褒义又有贬义的句子),并且含有多于1个分段(segment,段是用逗号或分号分隔的句子),在BPC的基础上使用一下三个步骤判断整体的极性。(BPC是2010年NTCIR-8中中文评测的最好指标,可以对输出结果给出置信分值)

    1. 识别所有的篇章关系,同时识别出nucleus和sateliite
    2. 对每个篇章关系片段赋予极性。如果有冲突的情况,如是Contrast关系而两个子句的极性相同,则把置信度高的赋给整句
    3. 如果一个单一句中包含多于1个关系实例,句子的整体极性会以投票的方式来判断
  • 相关阅读:
    js---查找数组中的最大值(最小值),及相应的下标
    JS数组遍历的几种方法
    在 forEach 中使用 async/await 遇到的问题
    js 事件冒泡和事件捕获
    JS中dom0级事件和dom2级事件的区别介绍
    Vue集成Ueditor
    vue富文本编辑器 Vue-Quill-Editor
    Redis问题1---redis满了怎么办
    jQuery火箭图标返回顶部代码
    遇到的小问题
  • 原文地址:https://www.cnblogs.com/darry/p/2317453.html
Copyright © 2011-2022 走看看