zoukankan
html css js c++ java
LSI潜在语义索引
https://www.jianshu.com/p/28f2bc62a75b
1.定义
利用SVD分解来找到词项-文档矩阵C的某个
低秩逼近
,在这个低秩逼近下能够为文档集中的
每篇文档产生一个新的表示
。同样,查询也可以映射到这个低秩表示的空间,从而可以
基于新的表示
来进行查询和文档的相似度计算。这个过程称为LSI。(潜在语义索引)
LSI通过term-document矩阵的SVD将term和document投影到一个低维的空间中,在这个过程中丢弃了一些影响比较小(小的奇异值)的信息,这些信息可能是噪声。
查看全文
相关阅读:
【大数据】WAL预写日志
【Teradata】运维3个9或4个9代表什么
【大数据-文摘笔记】Veritas NBU简介
【Teradata】DSA+NBU备份1148错误
【大数据-文摘笔记】京东HBase平台进化与演进
【Teradata 工具】使用SQL Assistant连接每次都需要重新输入口令
【金融】银行有什么分类
VS 创建虚拟目录失败,映射到其他文件夹!
js cookie读取
解决“在证书存储区中找不到清单签名证书”
原文地址:https://www.cnblogs.com/BlueBlueSea/p/13941522.html
最新文章
Fedora 24最新工作站版本之四大重要改进
12个Linux进程管理命令介绍
Bt(宝塔面板)忘记用户名密码的解决方案
onedrive同步其他任意文件夹
islide插件安装过程闪退
hexo 写文章创建文件自动打开编辑器
前后端分离实现上传图片的功能
js数组去重的几种方法
js每隔1s打印一下数组中的内容
Ajax请求放在Vue哪个生命周期中
热门文章
函数add同时满足add(a,b)和add(a)(b),且输出结果为a+b,如:add(2,3)和add(2)(3)均得到5。
vue中的插槽slot
CSS实现两栏布局
CSS实现等边三角形
CSS实现等高布局
数据库-范式
算法题-25匹马,找出最快的3匹,最少需要多少次比赛
【数据仓库】数据仓库概述
Gartner 全球云存储魔力象限:阿里云跻身四强 全球前四
【大数据】磁带LTO6和LTO7
Copyright © 2011-2022 走看看