情感分析的研究任务
一 情感信息抽取
情感信息抽取->情感信息分类(主客观分类,褒贬分类)(分类粒度:粗细)
1.评价词语的抽取和判别
一开始使用基于词典的方法,后来采用基于自动挖掘的方法。由于存在一词多义现象,存在很多歧义词。
后来基于预料库的方法,简单易行但存在噪声,准确度难以保证
2.评价对象的抽取
基于规则等
3.观点持有者抽取
命名实体处理
4.组合评价单元的抽取
主观表达式的抽取,
评价短语的抽取,如‘very good’,
评价搭配的抽取,如‘油耗高’,
二 情感信息分类
1.主客观信息分类
难点:客观句中有情感词,主观句中无情感词
基于情感知识的方法(词典),基于特征分类的方法(机器学习)。
2.观点分类和挖掘
情感信息检索与归纳
1.情感信息检索
检索准则:主题相关,具有情感倾向性
2.情感信息归纳
基于产品属性的文摘:评价对象的识别->抽取产品属性情感句->判断情感倾向性
基于新闻评论的文摘
情感分析的评测
国际文本检索会议TREC,有相关情感分析任务。
国内情感评测COAE
情感分析的研究点
褒贬分析篇章级别,多模态情感分析