zoukankan      html  css  js  c++  java
  • (论文笔记)Deep Neural Network for YouTube Recommendation

    YouTube推荐系统上的深度神经网络
    【总结】
    在召回模型中,用到的特征比较粗,在训练过程中,目的是训练出一个用户向量u(通过用户本身的浏览和观看信息和统计学信息,假设是N维的),用户向量的用途分两种,线下training和线上serving。训练拟合的是后验概率,在serving中,就直接利用u和训练好的视频向量v,做一个概率计算得到top。
    在排序模型中,特征比召回的时候更细一些,除了用到召回模型的特征外,还认为其他候选信息,和视频本身的信息也是有用的,
    【模型解读】
    A.召回和排序
    召回的时候采用用户的历史信息和文档信息;排序的时候不仅采用这些还需要用到视频特征和其他候选信息。
     
    B.召回阶段
    输入:
    用户浏览历史、搜索历史、人口统计学信息concat而成的向量
    输出:
    分为离线训练和线上。线上直接用视频向量vj和用户向量u来查询N个。在training中,视频向量vj会在softmax中被学习出来,比如一个矩阵W(比如是M*N,M是视频的个数,那么W的第j行就是第j个视频的emb vj,类似CBOW训练词向量的方式)。离线训练softmax输出概率:
     
     
    C.排序阶段
    输入:
    各种特征,其中重要的特征主要来源为:用户或item本身的特征,相似item之间的特征,负反馈特征;
    为降低维度,对topn进行emb,其余直接是0向量。
    输出:
    serving采用指数,训练的时候拟合的是逻辑回归的权重,之所以这么定义是因为该模型的建模目标是期望观看时长,数学说明如下。设有点击的为正样本,无点击的为负样本,正样本需要根据观看时长进行加权,负样本权重为1,所以odds是,k是正样本数量,因为k很小,所以约等于,就是期望观看时长,故逻辑回归的odds就是可以视为是期望观看时长,那么在serving的推理阶段,可以直接采用指数形式,w为神经网络训练参数结果,x是输入的特征,计算得到期望观看的时长。
     
    【参考链接】
  • 相关阅读:
    poj1179 Polygon
    poj2677 Tour
    MariaDB10多实例--mysqld_multi
    MariaDB10源码安装
    linux下php+freetds连接SQL server2012
    MariaDB yum安装
    mongoDB yum安装
    pxe 引导clonezilla live万能备份与还原
    (转) pppd 中文man页面
    Unix-like DisplayManager/LoginManager/WindowManager
  • 原文地址:https://www.cnblogs.com/liuxiangyan/p/15766936.html
Copyright © 2011-2022 走看看