zoukankan      html  css  js  c++  java
  • 探索分类模型中加入词性和句法特征

    最近一直在做的意见解释挖掘任务,尝试加入词性特征和句法特征来提高性能。

    一、方法

    调研了一下大概可以有3种方法在分类模型中加入句法特征:

    1. 直接使用stanford nlp工具得到每个词的父亲结点信息作为该词的句法特征加入分类模型。

    2. 用treelstm训练树型结构模型,得到树中每个结点的信息,获取每个词在树中的位置信息作为句法特征。这种方法与方法1相比,不仅包含了父亲结点的信息,还包含有如树深等更多的信息。

    3. 参考师兄coling论文中的方法,使用Biaffine parse模型的MLP隐层信息作为句法特征加入分类模型。这种方法与方法1相比,减少了由stanford nlp的错误结果带来的影响,与方法2相比,MLP隐层信息中不仅包含父亲结点信息,还包含了弧上关系信息。

    二、实验结果

    想要加入词性和句法特征就需要对语料进行分词,所以先用结巴分词进行分词之后,在分类模型中分别加入词性特征和句法特征,得到了如下表1的实验结果:
    表1 加入词性和句法特征的意见解释分类结果
     
    三、结果分析
    实验结果表明,在意见解释分类模型中加入句法特征不能提升分类性能。但是同时我们也可以发现,只加入词性特征的分类模型能得到比之前Baseline模型更高的分类效果,这说明词性特征是对分类有效的。
  • 相关阅读:
    使用javaDate类代数据仓库维度表
    Hermes和开源Solr、ElasticSearch 不同
    MapReduce 异常 LongWritable cannot be cast to Text
    吐槽CSDN编辑
    Codeforces 452A Eevee
    看不清楚未来,请做好如今
    JDBC数据库连接
    mixpanel实验教程(2)
    使用jquery+一般处理程序异步载入信息
    Eclipse中的Maven项目报Unbound classpath variable错误
  • 原文地址:https://www.cnblogs.com/Joyce-song94/p/9143857.html
Copyright © 2011-2022 走看看