zoukankan      html  css  js  c++  java
  • 共现矩阵

    原文链接:https://blog.csdn.net/qq_35290785/article/details/98231826

    主要用于发现主题,解决词向量相近关系的表示; 将共现矩阵行(列)作为词向量

    例如:语料库如下: 
    • I like deep learning. 
    • I like NLP. 
    • I enjoy flying.

    则共现矩阵表示如下:(使用对称的窗函数(左右window length都为1) )

    例如:“I like”出现在第1,2句话中,一共出现2次,所以=2。 
    对称的窗口指的是,“like I”也是2次

    将共现矩阵行(列)作为词向量表示后,可以知道like,enjoy都是在I附近且统计数目大约相等,他们意思相近

    但是共现矩阵也存在很多问题

    面临稀疏性问题、向量维数随着词典大小线性增长

    解决:SVD、PCA降维,但是计算量大



  • 相关阅读:
    poj 1010
    poj 1060
    poj 1001
    POJ 2769
    POJ 2559
    poj 2403
    POJ 1088
    设置全屏与退出全屏
    iframe 父子页面方法调用
    Web 前端面试小知识
  • 原文地址:https://www.cnblogs.com/tingtin/p/13205410.html
Copyright © 2011-2022 走看看