在做句子相似度的项目时,可以参考用Sentences Involving Compositional Knowledge数据集,它包含了一万个英文句子对,标注了相似度,尺度范围是,1-5。
官方及下载地址:clic.cimec.unitn.it/composes/sick.html
SICK 的发布遵照以下协议:
Creative Commons Attribution-NonCommercial-ShareAlike 3.0
Unported License (http://creativecommons.org/licenses/by-nc-sa/3.0/deed.en_US)
在发布的研究中应用SICK时,请应用:
M. Marelli, S. Menini, M. Baroni, L. Bentivogli, R. Bernardi and R. Zamparelli. 2014. A SICK cure
for the evaluation of compositional distributional semantic models. Proceedings of LREC 2014,
Reykjavik (Iceland): ELRA.