zoukankan      html  css  js  c++  java
  • 推荐系统实战(1)

    “信息过载”与推荐系统

    茫茫的互联网中有越来越多的海量内容,而且这些内容的增长速度已经超越了人类大脑容量的处理速度,我们把这个问题叫做“信息过载”。

    我们需要相应的技术手段来帮助我们处理“信息过载”问题。解决或者缓解“信息过载”问题的核心是需要一个漏斗来减少最终呈现给用户的信息数量(即 N -> 1问题),手段主要是下面三种:
    融合
    对相似的信息进行聚类融合,最终只呈现融合后的信息
    摘要
    对信息进行摘要,使得用户通过最少的内容来获取核心信息
    筛选
    对信息进行过滤,只呈现对用户有用的信息。

     

    Alt text

    Alt text

    推荐系统主要就是通过筛选的方法来解决“信息过载”问题的。那么现在问题来了, 什么是“对用户有用的信息“呢?我们可以先来看下信息的长尾曲线:

    Alt text
    “对用户有用的信息”可以分为两类:

      1. Tall Head

      这一部分是大家都在看的热点内容,是互联网用户用手投票出来的内容(通过点击,点赞,评论, 推荐,转发,收藏等用户行为),用户需要这些信息来保持与社会的同步。我们叫它“基于热度的推荐”

      2. Long Tail

      这一部分体现的是用户自身独特的兴趣和趣味,它很小众但却是技术最能打动用户的地方。我们叫它“个性化推荐”

    为什么要解决“信息过载”问题

    为什么互联网公司热衷于解决“信息过载”问题呢?因为解决了它,会给商业带来至少两点好处:

      1.提高用户指标: 展示对用户有用的信息会带动用户的互动(提高点击率,转化率…)和粘性(提高用户逗留时长,DAU…),用户指标的提高与商业指标的提升呈明显的正比关系(对电商平台而言直接对应GMV,客单价,客户流失率等; 对内容平台直接对应可能产生的广告收益…)。

      2.提高用户模型价值:个性化推荐的副产品是用户画像,这些用户画像是用户特征的多维度刻画,本身就是一种高价值的数据产品,可用于需要定向化投放的各种产品(如广告)。DMP(Data Management Platform)公司就是卖这个的。

  • 相关阅读:
    物理机与虚拟机互通
    error while loading shared libraries: libevent-2.2.so.1: cannot open shared object file: No such file or directory
    DateTime.Now.ToFileTime
    洛谷-P2249 【深基13.例1】查找
    洛谷-P3817 小A的糖果
    洛谷-P3612 [USACO17JAN]Secret Cow Code S
    洛谷-P5019 铺设道路
    洛谷-P2437 蜜蜂路线
    洛谷-P1044 栈
    洛谷-P1255 数楼梯
  • 原文地址:https://www.cnblogs.com/Matrix_Yao/p/6209206.html
Copyright © 2011-2022 走看看