摘要
分布语义模型(DSM)或单词嵌入被广泛用于语义相似性和相关性的预测. 但大多数DSM模型或单词嵌入每个单词都使用一个向量, 而没有考虑多义和同音异义词.
语义相似性和相关性的预测工作中. 但大多数单词嵌入时使用一个向量, 而没有考虑多义和同音异义词.例如, dollar和bank的词嵌入之间的余弦距离很好地表明了两个单词的语义相关性, 但和river和bank的词嵌入之间的余弦距离没有意义.人类可以快速, 准确地识别该词的含义. 但是, 由于上下文信息可能非常弱并且包含误导性线索, 因此机器很难自动消除词义的歧义.
论文中提出了一种有监督的微调框架, 用基于词法语义资源将现有的单原型词嵌入转换为多原型词嵌入.
转载https://blog.csdn.net/qq_39094534/article/details/107327425