特定的背景和不同的驱动力:
高层对低质量的数据表现的感知疼痛,对数据治理巨大价值的认知
业务模式: 对内 2B 2C 数据去驱动流程效率的提升 生产力的发展最终还会受制于生产关系
数据规模: 海量数据的存储和分析压力-有没有?
数据确权:流程管理体系 人事组织体系 企业文化体系 企业制度体系
人才队伍:懂技术,懂业务的数据管理的专业队伍
数据源:数据采集的全面性
数据应用:数据的生命周期管理 多维数据分析
架构: 企业级信息架构 部门级信息架构
数据工作框架-企业级信息架构
数据源:
数据源数字化,数据采集
数据源创建、读取、更新、删除
数据底座
数据湖: 数据交换层+数据处理层
主题关联:基础模型、融合模型及洞察主题
数据消费:数据处理层的分析引擎+ 数据应用应用层
数据治理: 数据资产管理 计算资源管理 存储资源管理
数据治理融入IT实施中
数据分类
1.数据分类:
内部数据和外部数据
非结构化数据和结构化数据
01. 结构化数据:
观测数据:观测工具
软感知数据
硬感知数据
基础数据
主数据
事务数据
报告数据
规则数据
02.非结构化数据:需要智能化的IT技术支持
管理对象的标题 格式 等基本特征和定义
对数据内容的客观理解进行管理:标签 ,相似性检索 相似性连接
治理核心: 对其基本特征与内容进行提取,并通过元数据落地进行开展
2.治理: 元数据
技术元数据
业务元数据
操作元数据
本书结构:
综合治理体系、
数据分类
信息架构、
数据湖和数据主题联结-数据底座
数据消费
数据质量和数据安全
问题:
额外的人工转换和翻译,这极大增加人工成本,延长业务执行周期