最近一直在做的意见解释挖掘任务,尝试加入词性特征和句法特征来提高性能。
一、方法
调研了一下大概可以有3种方法在分类模型中加入句法特征:
1. 直接使用stanford nlp工具得到每个词的父亲结点信息作为该词的句法特征加入分类模型。
2. 用treelstm训练树型结构模型,得到树中每个结点的信息,获取每个词在树中的位置信息作为句法特征。这种方法与方法1相比,不仅包含了父亲结点的信息,还包含有如树深等更多的信息。
3. 参考师兄coling论文中的方法,使用Biaffine parse模型的MLP隐层信息作为句法特征加入分类模型。这种方法与方法1相比,减少了由stanford nlp的错误结果带来的影响,与方法2相比,MLP隐层信息中不仅包含父亲结点信息,还包含了弧上关系信息。
二、实验结果
想要加入词性和句法特征就需要对语料进行分词,所以先用结巴分词进行分词之后,在分类模型中分别加入词性特征和句法特征,得到了如下表1的实验结果:
表1 加入词性和句法特征的意见解释分类结果
三、结果分析
实验结果表明,在意见解释分类模型中加入句法特征不能提升分类性能。但是同时我们也可以发现,只加入词性特征的分类模型能得到比之前Baseline模型更高的分类效果,这说明词性特征是对分类有效的。