zoukankan      html  css  js  c++  java
  • 推荐系统

    一、推荐系统与评估

      0.一种数学定义:

        (1)设C为全体用户集合

        (2)设S为全部商品/推荐内容集合

        (3)设u是评判把si推荐给ci好坏判断函数

        (4)推荐是对于c<-C,找到s<-S,使得u最大,即:

          

          部分场景是topN推荐

        (5)通俗点说,推荐系统需要根据用户的历史行为,社交行为,兴趣点,所处上下文环境等等来判断用户当前的需求/感兴趣的item。

      1.推荐系统广泛应用

      2.推荐系统需求

      3.推荐系统结构与评估

        (1)准确度:

          

          

        (2)覆盖率:

           

        (3)多样性

          

        

      4.推荐系统结构

        

    二、推荐算法串讲

      1.基于内容的推荐(content-based algorithms)

        (1)特征:TF-IDF

        (2)基于标题内容近似度推荐

          计算书名向量的相似度,推荐TopN接近的

      2.协同过滤(neighborhood-based algorithms)(所有协同过滤的算法都是基于用户行为的)

          基于“近邻”的推荐算法

          根据用户在物品上的行为找到物品或者用户的“近邻”

          基于用户的协同过滤(user-based CF):求解的是某个用户与某个用户的相似度,求出加权平均然后再空缺位置进行填充

            

            基于用户有共同行为的物品,计算用户相似度

            找到“近邻”,对近邻在新物品的评价(打分)加权推荐

          基于物品的协同过滤(item-based CF)

            对于有相同用户交互的产品,计算物品相似度

            找到物品近邻进行推荐

          

        基于用户的协同过滤和基于物品的协同过滤的比较:

        

        协同过滤的优缺点:

        优点:

          (1)基于用户行为,因此对推荐内容无需先验知识

          (2)秩序要用户和商品关联矩阵即可,结构简单

          (3)在用户行为丰富的情况下效果好

        缺点:

          (1)需要大量的显性/隐性用户行为

          (2)需要通过完全相同的商品关联,相似的不行

          (3)假定用户的兴趣完全取决于之前的行为,而和当前上下文环境无关

          (4)在数据稀疏的情况下受影响。可以考虑二度关联

      3.矩阵分 解与隐语义模型(LFM,FM) 

      4.word2vec在推荐系统中的简单应用

      5.推荐系统冷启动问题:

        对于新用户

        (1)所有推荐系统对于新用户都有这个问题

        (2)推荐非常热门的商品,收集一些信息

        (3)在用户注册的时候收集一些信息

        (4)在用户注册完成之后,用一些互动娱乐游戏等确定喜欢与不喜欢

        对于新商品

        (1)根据本身的属性,求出原来商品的相似度

        (2)Item-based协同过滤可以推荐过去

      6.隐语义模型

        (1)我们有用户评分矩阵,其中部分位置是空的

        (2)我们希望尽量正确的填满未打分的项

        (3)简单使用SVD不好吗?

          SVD的时间复杂度是O(m^3)

          原矩阵缺省值比较多,不易用0来填补

          

    三、电商推荐系统选讲

    四、推荐系统案例

      1.简单CF与LFM实现

      2.scikit-Surprise完成推荐

  • 相关阅读:
    VMware的安装
    草根创业专题开篇
    转:分布式和集中式版本控制工具svn,git,mercurial
    sql db to sqlite
    简单办公自动化系统开发与思考1
    sql ef datacontext muti thread problem
    谈云计算,服务器运算的惊天骗局
    ios5.1二货,手贱,解决方案
    阿曹的创业点子1人人快递
    创业点子wifi anywhere
  • 原文地址:https://www.cnblogs.com/bigdata-stone/p/10437756.html
Copyright © 2011-2022 走看看