背景:stanford的计算广告学(computational advertising)课程,yahoo的人主讲,课程链接:http://www.stanford.edu/class/msande239/#lecture-handouts,这个ppt使其中的一讲,93页
主要内容:
1. Display ad targeting:
相比于搜索广告来讲,搜索体现了明显的意图,显示广告,用户只有浏览行为,而浏览行为体现出的用户行为比起搜索行为差了好多,所以是“High entropy” of user intent。相比而言,显示广告的CRT和搜索广告相比也差了几个数量级。
如何降低“high entropy"?利用搜索行为、利用用户交易行为(购买、放入购入车、添加关注等等)
展示广告定向可以分解为三个相关联的任务:
(1)User profile generation: describe the user
(2)Audience selection: find the best audience for a given ad
(3)Performance prediction: find the best ad for a given impression (we have discussed this before)
(2)Audience selection: find the best audience for a given ad
(3)Performance prediction: find the best ad for a given impression (we have discussed this before)
对上面三个任务,细分来说:
(1)User profile generation:可以利用的信息(用户注册信息,活动——点击、浏览等,用户的社会关系——邮件组、好友等)。总之,user data --> intents and interests
(2)Audience selection: 与(1)相关联,但是目标不同,可以由不同的公司来做
用户筛选与广告筛选是一个对偶问题。
2. 传统定向广告技术
传统的定向广告技术都是把人群进行分类,在此基础上将人群与广告类别建立起来联系,对特定人群投放特定的广告。
细分为如下几类技术:
(1)Demographic targeting ——人口统计学
(2)Geo targeting —— 地理位置信息
(3)Behavioral targeting —— 用户行为信息
(4)Retargeting —— 重定向广告
(2)Geo targeting —— 地理位置信息
(3)Behavioral targeting —— 用户行为信息
(4)Retargeting —— 重定向广告
细分来详细说:
(1)Demographic targeting:网站的注册信息,年龄、性别、收入、位置、兴趣等等
这些信息有的是用户直接注册的,有些是需要推断的,方法是根据用户的行为,训练分类器,进行特定类别的分类;除了分类器外,还可以利用 网页——用户 之间的二部图、辅以一些降维技术(SVD)。
(2)Geo targeting:
这部分信息比较难获得,即便获得也不见得准确。获取方式:用户注册、用户ip、gps、用户浏览器或者操作系统的语言设置。在手机上LBS更有需求。
(3)Behavioral targeting:
基于用户历史行为的定向广告,历史性为包括:浏览、搜索、购买、广告点击等等
(4)Retargeting:
ppt上说的不是太详细,我理解是Retargeting的过程是:用户近期浏览行为(或者其他行为),抽取关键词,存放在用户cookie当中,当用户浏览网页有广告投放需求的时候,通过cookie中的关键词来决定投放什么广告
以下的内容,每一节介绍一篇yahoo发表的论文
3. Social targeting: the power of the graph
是指基于社交网络的定向广告。
社交网络能够利用量方面信息:1. 用户注册信息;2. 用户关系链
“The social graph can be used to smooth the data available” —— 作者认为社交关系链的作用之一,是对用户当前缺失注册信息的一种平滑,可以根据他的朋友是什么样的人来推断他是什么样的人
graph分几种:1. mail graph(邮件之间的关系);2. social graph
graph的用法:1. 分类(将graph特征加入到标准behavior targeting流程中);2. ensemble(结合behavior model和graph model);3. network propagation(随机游走的方式,推测网络中缺失的属性值)
实验表明:单独的用户行为特征在targeting中远好于单独的graph特征,不过两者结合的能取得最好的结果。
4. current trend in targeting
从基于用户群划分的模型逐渐转向基于模型的、更加精准的个性化推荐
5. User profile generation: interests and intents
——Working with high entropy of intent
讨论了人口属性中对定向广告的影响。
有一个观察:用户在买了某个大件商品之后,不再可能再买同样的东西了,此时投放广告是没用的
6. Generative language models for user profiles
讲的是CIKM2011上的一篇文章。
形式化“Audience selection task”任务:给定一群种子用户,寻找和当前用户群相似的用户,类似信息检索。
种子用户的用户行为用event来表示,event序列用语言模型来建模
7. Learning BT categories from click data
预测CRT的。用的回归。相关细节和公式可以参考原文。
8. Information-Theoretic User Profile Generation
9. 总结:直接copy&paste原文了
! -Targeting is a key step in differentiation of impressions and
extracting value!
! -Traditional targeting: demo, geo, BT
! ---How to get the data from the user?
! ---Infer the data from historical activity
extracting value!
! -Traditional targeting: demo, geo, BT
! ---How to get the data from the user?
! ---Infer the data from historical activity
! One of the key step in targeting is user profile generation
! ---Generative models to assign probability of a sequence of events
! ---Weighting based on time, event type and content
! ---Predict the counts of events in certain categories
! ---Clustering and other unsupervised techniques useful – more to come in the next lecture