- 推荐思路
利用贝叶斯分类
通过统计某用户购买的所有商品的分部特性,统计该用户购买商品的分布情况
利用搜索记录
利用搜索记录也可以以对用户推荐商品,网站广告位上的JavaScript读取了浏览器本地的cookies(用于存储浏览器上的表单信息,登录信息和搜索关键词等)和当前界面的文本信息,并提取关键词,最后根据这些关键词猜测用户可能感兴趣的商品
优化 基于用户的协同过滤、基于商品的协同过滤
- User-based CF
用户进入网站时,网店系统找到和该用户兴趣类似的人,看看他们喜欢什么,就给该用户推荐什么
如何找到兴趣类似的人:余弦相似性(比较两个向量的相似性) 这个是计算用户相似度
最相似的是1,最不相似的是-1
- Item-based CF
这个是计算物品相似度,根据物品相似度和用户偏好生成推荐列表
分子是同时喜欢A和B两种商品的用户数量,分母是喜欢A的用户数量和喜欢B的用户数量乘积的平方根
- 优化问题
在基于商品的协同过滤中,为了保证商品的多样性,有时要做优化
物品相似度的归一化算法
- 小结
利用余弦相似度来度量距离