zoukankan
html css js c++ java
LSI潜在语义索引
https://www.jianshu.com/p/28f2bc62a75b
1.定义
利用SVD分解来找到词项-文档矩阵C的某个
低秩逼近
,在这个低秩逼近下能够为文档集中的
每篇文档产生一个新的表示
。同样,查询也可以映射到这个低秩表示的空间,从而可以
基于新的表示
来进行查询和文档的相似度计算。这个过程称为LSI。(潜在语义索引)
LSI通过term-document矩阵的SVD将term和document投影到一个低维的空间中,在这个过程中丢弃了一些影响比较小(小的奇异值)的信息,这些信息可能是噪声。
查看全文
相关阅读:
acm课程练习2--1002
acm课程练习2--1001
SDAU课程练习--problemQ(1016)
SDAU课程练习--problemG(1006)
SDAU课程练习--problemO(1014)
SDAU课程练习--problemB(1001)
SDAU课程练习--problemA(1000)
SDAU课程练习--problemC
SDAU课程练习--problemE
不安全函数(转)
原文地址:https://www.cnblogs.com/BlueBlueSea/p/13941522.html
最新文章
洛谷P1897电梯里的爱情题解
P2672 推销员 优先队列 + 贪心
[HEOI2016/TJOI2016]序列 CDQ分治
[JSOI2009]计数问题 二维树状数组
[NOI2015]软件包管理器 树链剖分
[AHOI2009]最小割 最小割可行边&必须边
[ZJOI2011]最小割 & [CQOI2016]不同的最小割 分治求最小割
[CQOI2012]交换棋子 网络流
[CQOI2017]老C的方块 网络流
STL使用记录
热门文章
[SHOI2012]回家的路 最短路
bzoj3224: Tyvj 1728 普通平衡树(打个splay暖暖手)
Codeforces 55D Beautiful numbers(数位dp)
poj:1850 Code(组合数学?数位dp!)
bzoj1833: [ZJOI2010]count 数字计数(数位dp)
bzoj1025: [SCOI2009]游戏(DP)
bzoj2165: 大楼(倍增floyd)
NOIP2015Day2T3运输计划(二分+树上差分)
NOIP2015Day2T2子串(字符串dp)
NOIP2016Day2T2蚯蚓(队列+坑爹洛谷毁我青春)
Copyright © 2011-2022 走看看