zoukankan      html  css  js  c++  java
  • 标签体系中的一些基本概念

    标签体系中的一些基本概念

    基础概念

    实体标签

    • 必须是名词,且必须是唯一指代

    概念标签

    • 概念标签通常表示的是“一类”或“某种相似”的内容

    主题词

    • 用来填补不同级别标签之间的空白,保持了推荐的多样性又不至于过分精准而导致极度收敛

    标签体系构建的原则

    一、放弃⼤而全的框架,以业务场景倒推标签需求

    二、标签生成自助化,解决效率和沟通成本

    • 标签生成的自助化能够让沟通成本降最低
    • 标签生成的自助化,可重复修改的规则,降低无效标签的堆积
    • 释放数据团队人力,释放业务团队的想象力

    三、有效的标签管理机制

    标签体系的实施架构

    数据加工层

    • 数据加工层收集,清洗和提取来处理数据,收集了所有数据之后,需要经过清洗:去重,去无效数据,去异常数据等等。然后再是提取特征数据

    数据业务层

    • 用来维护整个标签体系,集中在一个地方来进行管理
    • 主要包括以下核心内容
      • 定义业务方需要的标签。
      • 创建标签实例。
      • 执行业务标签实例,提供相应数据。

    数据应用层

    标签体系的设计

    1.业务梳理

    2.标签分类

    • 梳理标签分类时,尽可能按照MECE原则,相互独立,完全穷尽。每一个子集的组合都能覆盖到父集所有数据。标签深度控制在四级比较合适,方便管理,到了第四级就是具体的标签实例

    3.标签的模型

    • 从数据的失效性来看
      • 静态属性标签。长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的事实,几乎不会改变
      • 动态属性标签。存在有效期,需要定期地更新,保证标签的有效性。比如用户的购买力,用户的活跃情况。
    • 从数据的提取维度来看
      • 事实标签。既定事实,从原始数据中提取。比如通过用户设置获取性别,通过实名认证获取生日,星座等信息
      • 模型标签。没有对应数据,需要定义规则,建立模型来计算得出标签实例。比如支付偏好度。
      • 预测标签。参考已有事实数据,来预测用户的行为或偏好。比如用户a的历史购物行为与群体A相似,使用协同过滤算法,预测用户a也会喜欢某件物品。

    标签最终呈现的形态要满足两个需求:

    • 1.标签的最小颗粒度要触达到具体业务事实数据,同时支持对应标签实例的规则自定义
    • 2.不同的标签可以相互自由组合为新的标签,同时支持标签间的关系,权重自定义。
    记录学习的点点滴滴
  • 相关阅读:
    利用STM32播放音乐
    在MDK中使用$Sub$$和$Super$$的记录
    printf函数输出格式控制记录
    I2C软件实现
    C语言单项链表
    CreateEvent函数使用记录
    C语言宏定义使用记录
    GIT推送本地数据到远程空仓库
    2020-ECCV-Local Correlation Consistency for Knowledge Distillation阅读笔记
    2020-ECCV-Feature Normalized Knowledge Distillation for Image Classfication阅读笔记
  • 原文地址:https://www.cnblogs.com/yangzilaing/p/14928724.html
Copyright © 2011-2022 走看看