zoukankan      html  css  js  c++  java
  • 推荐系统实战(1)

    “信息过载”与推荐系统

    茫茫的互联网中有越来越多的海量内容,而且这些内容的增长速度已经超越了人类大脑容量的处理速度,我们把这个问题叫做“信息过载”。

    我们需要相应的技术手段来帮助我们处理“信息过载”问题。解决或者缓解“信息过载”问题的核心是需要一个漏斗来减少最终呈现给用户的信息数量(即 N -> 1问题),手段主要是下面三种:
    融合
    对相似的信息进行聚类融合,最终只呈现融合后的信息
    摘要
    对信息进行摘要,使得用户通过最少的内容来获取核心信息
    筛选
    对信息进行过滤,只呈现对用户有用的信息。

     

    Alt text

    Alt text

    推荐系统主要就是通过筛选的方法来解决“信息过载”问题的。那么现在问题来了, 什么是“对用户有用的信息“呢?我们可以先来看下信息的长尾曲线:

    Alt text
    “对用户有用的信息”可以分为两类:

      1. Tall Head

      这一部分是大家都在看的热点内容,是互联网用户用手投票出来的内容(通过点击,点赞,评论, 推荐,转发,收藏等用户行为),用户需要这些信息来保持与社会的同步。我们叫它“基于热度的推荐”

      2. Long Tail

      这一部分体现的是用户自身独特的兴趣和趣味,它很小众但却是技术最能打动用户的地方。我们叫它“个性化推荐”

    为什么要解决“信息过载”问题

    为什么互联网公司热衷于解决“信息过载”问题呢?因为解决了它,会给商业带来至少两点好处:

      1.提高用户指标: 展示对用户有用的信息会带动用户的互动(提高点击率,转化率…)和粘性(提高用户逗留时长,DAU…),用户指标的提高与商业指标的提升呈明显的正比关系(对电商平台而言直接对应GMV,客单价,客户流失率等; 对内容平台直接对应可能产生的广告收益…)。

      2.提高用户模型价值:个性化推荐的副产品是用户画像,这些用户画像是用户特征的多维度刻画,本身就是一种高价值的数据产品,可用于需要定向化投放的各种产品(如广告)。DMP(Data Management Platform)公司就是卖这个的。

  • 相关阅读:
    欧拉公式
    isap的一些想法
    错误合集
    Hello World
    PAT (Advanced Level) Practice 1068 Find More Coins
    PAT (Advanced Level) 1087 All Roads Lead to Rome
    PAT (Advanced Level) 1075 PAT Judge
    PAT (Advanced Level) 1067 Sort with Swap(0, i)
    PAT (Advanced Level) 1017 Queueing at Bank
    PAT (Advanced Level) 1025 PAT Ranking
  • 原文地址:https://www.cnblogs.com/Matrix_Yao/p/6209206.html
Copyright © 2011-2022 走看看