zoukankan      html  css  js  c++  java
  • 标签体系中的一些基本概念

    标签体系中的一些基本概念

    基础概念

    实体标签

    • 必须是名词,且必须是唯一指代

    概念标签

    • 概念标签通常表示的是“一类”或“某种相似”的内容

    主题词

    • 用来填补不同级别标签之间的空白,保持了推荐的多样性又不至于过分精准而导致极度收敛

    标签体系构建的原则

    一、放弃⼤而全的框架,以业务场景倒推标签需求

    二、标签生成自助化,解决效率和沟通成本

    • 标签生成的自助化能够让沟通成本降最低
    • 标签生成的自助化,可重复修改的规则,降低无效标签的堆积
    • 释放数据团队人力,释放业务团队的想象力

    三、有效的标签管理机制

    标签体系的实施架构

    数据加工层

    • 数据加工层收集,清洗和提取来处理数据,收集了所有数据之后,需要经过清洗:去重,去无效数据,去异常数据等等。然后再是提取特征数据

    数据业务层

    • 用来维护整个标签体系,集中在一个地方来进行管理
    • 主要包括以下核心内容
      • 定义业务方需要的标签。
      • 创建标签实例。
      • 执行业务标签实例,提供相应数据。

    数据应用层

    标签体系的设计

    1.业务梳理

    2.标签分类

    • 梳理标签分类时,尽可能按照MECE原则,相互独立,完全穷尽。每一个子集的组合都能覆盖到父集所有数据。标签深度控制在四级比较合适,方便管理,到了第四级就是具体的标签实例

    3.标签的模型

    • 从数据的失效性来看
      • 静态属性标签。长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的事实,几乎不会改变
      • 动态属性标签。存在有效期,需要定期地更新,保证标签的有效性。比如用户的购买力,用户的活跃情况。
    • 从数据的提取维度来看
      • 事实标签。既定事实,从原始数据中提取。比如通过用户设置获取性别,通过实名认证获取生日,星座等信息
      • 模型标签。没有对应数据,需要定义规则,建立模型来计算得出标签实例。比如支付偏好度。
      • 预测标签。参考已有事实数据,来预测用户的行为或偏好。比如用户a的历史购物行为与群体A相似,使用协同过滤算法,预测用户a也会喜欢某件物品。

    标签最终呈现的形态要满足两个需求:

    • 1.标签的最小颗粒度要触达到具体业务事实数据,同时支持对应标签实例的规则自定义
    • 2.不同的标签可以相互自由组合为新的标签,同时支持标签间的关系,权重自定义。
    记录学习的点点滴滴
  • 相关阅读:
    sql over(partition by) 开窗函数的使用
    利用curl函数处理GET数据获取微信公众号的access_token
    2018.4.12
    字段和属性
    C#实现回车键登录
    判断DataTable里面数据是否有重复数据
    一个强大的人民币大写转换的正则表达式
    C#将image中的显示的图片转换成二进制
    遍历Dev LayoutControl中的所有控件信息
    遍历窗体中所有控件的信息
  • 原文地址:https://www.cnblogs.com/yangzilaing/p/14928724.html
Copyright © 2011-2022 走看看