Using Structured Event to Predict Stock Price Movement: An Empirical Investigation
[Xiao Ding, Yue Zhang, Ting Liu, Junwen Duan] 2014,EMNLP
研究目标:美股,标普500,路透社新闻,彭博社新闻
前提:新闻事件会对股票市场产生影响,造成价格的波动变化
前人工作的不足点:以前针对新闻驱动的股票市场的预测模型仅仅依赖了一些比较浅层的特征,例如bags-of-words, named entities and noun phrases模型。因为没有捕捉到实体关系的信息,所以不能很好的刻画完整的事件。
本文的改进:使用Open Information Extraction (Open IE)技术来抽取结构化的事件,避免了人工提取的巨大工作量。使用了线性与非线性的模型来对事件与市场之间的隐含的复杂的关系进行实证研究。在标普500中准确率为60%,在个股的准确率为70%。baseline为bags-of-words-based 模型。
(个人思考)结构化的事件表示相对于词袋模型有什么优点?
词袋模型不会区别主语、宾语,这样造成的问题在于,可能有一条新闻中提到“苹果起诉三星侵权”,我们知道这条新闻对于其主语“苹果”应该是利好或者是无影响,但是对于宾语“三星”应该是利空。词袋模型无法区别这其中的关系。
挑战:
- 如何提取结构化的事件?
- 使用Open IE技术(这一点没有什么贡献性)
- 提取出结构化事件之后如何来学习事件中的关系,以及如何来应用该关系来对股价进行预测?
- 使用深度神经网络模型
新闻数据:路透社106521条新闻,彭博社447145条新闻
事件的表示:E=(O1, P, O2, T),O1表示主语,P表示动作,O2表示宾语,T是时间戳。
事件提取的具体步骤:
很多时候可能不同的新闻表示的意义是一致的,例如“微软吞并诺基亚的手机部门”,“微软收购诺基亚的手机部门”。为了提高事件提取的泛化能力,本文不仅用了Open IE技术,而且还用了WordNet,VerbNet。首先用Open IE来将事件提取出来,然后用WordNet将其中的词统一格式,例如将词的复数形式恢复成原型,等等。VerbNet是为了将所有的动词统一归类,例如上述的“吞并”,“购买”属于同一类。
实例:用Open IE得到了一个事件,“Private sector, adds, 114000 jobs”,用WordNet将adds变为add,jobs变为job,然后用VerbNet将add归为<multiply_class>,最终的事件表示为“Private sector, <multiply_class>, job”。
(个人思考)本文重点在于提出如何来捕获事件的结构,充分利用事件的结构信息,可以提高预测结果。
预测模型:
- 线性模型
- SVM
- 非线性模型
- 深度神经网络
特征表示:
- Bag-of-words features
- 使用TFIDF方法,将词转化成向量
- Event features
- 使用结构化事件,然后同样用TFIDF的方法将词转化成向量
实验结果:使用深度神经网络+Event Features效果最好。此外,经过实验表明,仅仅使用新闻的标题作为输入比标题+内容输入效果更好。
(个人思考)本文流程如下:将事件提取出来之后,利用TFIDF的方法构成词向量,然后输入到神经网络中进行上涨下跌分类。
(个人总结)本文中提取事件的方法感觉还是太过粗糙,并且最终利用TFIDF将事件转化成事件向量,这样的方法导致稀疏性比较严重。并且普通的人工神经网络太过简单。