倪江峰 伯隅@阿里的分享:标签、推荐、导购
0.27%的关键字占50%PV,以标签作为中间环节
标签为四种:品牌,品类,描述,属性
标签数据库:标题、结构化数据、详情
产品词挖掘:CRF模型
商品结构化属性:半开放式结构
描述词整理:LDA模型
不同类型的词之间的关系挖掘
机器标签---场景导购
标签市场化----买卖双方的标签消费
标签个性化
结合可视化做场景发现
目前这个标签系统仅做导购入口,与检索搜索无关----主要给商品更多的流量入口渠道
------------------------------------------
杨宇航@百度:推荐技术在UGC产品中的应用
领域业务主体可以考虑本体模型方式建模
豆瓣曾工程师的分享:NIP与豆瓣标签
标签是一种有意义的片段
用简化的方式描述对象
标签预测,用户画像,标签推荐
标签的提取
内部领域词库,使用n-gram生成候选词
词的内部独立性与外部独立性
词性标准---标签选择,词频特征
TF/IDF,TextRank,基于图的排序算法
主题模型:精度高但费时
DNN:WordZrec工具包
标签树有助于扩类别的推荐
Latent Factor:隐次特征