zoukankan      html  css  js  c++  java
  • Data

    1 - 概念与定义

    如果分析思维是一种结构化思考的体现,那么数据分析思维(简称数据思维)则是以数据为依托的结构化分析方式。
    不同于“我觉得”、“以前是怎样”、“其他人如何”这些直觉化、经验化、类比化的思考方式,数据思维是以数据为导向,依据严格的分析、统计和证明来指导具体的应用与操作。

    首先,要对事物本身有一个全面和客观的认识。

    • 以辩证思维来认识和看待事物,进行事物的分解和集成,全面客观地以数据说话,同时减少主观偏颇看法,
    • 结合外部环境、时间线、核心维度,全面的分析物的行为特征或动态展现
    • 关注事物的外在交互关系、内部结构和衔接,分析事物相关的内外环境因素

    然后,确定事物本身的关键属性、维度和分析评估体系。
    分析事物各关键指标特性间的相互制约和促进力。
    任何评估指标值的得出,一定有事物本身内在数据和运作机制进行支撑的,也就是说,将对事物分析后的数据映射到具体的可用的科学评价体系之上。

    1.1 - 数据分析的目的

    数据分析是为了能以量化的方式来分析业务问题并得出结论。
    “从历史数据中获得的洞察转化为可执行的决策或推荐的过程,将IT技术、管理科学和统计学结合以解决实际问题。”
    明确数据分析本身的目的,以终为始,也就是必须明确要解决的问题

    • 问题背景
    • 问题的具体含义
    • 针对现有问题采取的行为和结果

    1.2 - 数据分析的一般步骤

    业务指导数据,数据驱动业务。
    数据分析并不是一个结果,只是过程,在这个过程中是需要反馈和持续改进的。

    1.3 - 数据分析的作用

    数据分析的三大作用,主要是:现状分析、原因分析和预测分析。
    什么时候开展什么样的数据分析,需要根据我们的需求和目的来确定。

    • 数据分析的目的越明确,分析越有价值。
    • 明确目的后,需要梳理思路,搭建分析框架,把分析目的分解成若干个不同的分析要点,然后针对每个分析要点确定分析方法和具体分析指标;
    • 最后,确保分析框架的体系化(体系化,即先分析什么,后分析什么,使得各个分析点之间具有逻辑联系),使分析结果具有说服力。

    1.4 - 数据常识(Data Common Sense)

    对数据的变化保持敏感。
    这里的“变化”不仅仅来自数值本身的变动,更多的而来自“当前的数据”不同于平常的认知和判断。
    而这种“平常的认知和判断”,其实不仅是长期数据观察和分析所形成的“感觉”,也是你的“经历和经验”,甚至是“当前的知识结构和能力树”。
    能够认识到“变化”的来源,能有效避免掉入“主观判断”的陷阱。

    想要培养出数据敏感性和具备意识数据偏离的能力,这需要保持持久的观察和分析,以及足够的耐心和好奇心。
    业务数据对应着业务流程,业务流程暗含着业务需求,业务需求来自实际运营,从实际应用中去理解数据的产生和流动,有助于准确保持数据分析的“方向”不偏离“正轨”。

    • 形成查看关注数据的习惯,明确数值含义以及合理范围
    • 牢记核心数据、指标、报告和排名等,反复推算合理性
    • 抽离和规整数据,统一存放,方便查阅和分析

    2 - 搭建框架

    量化是为了统一认知,并且确保路径可回溯,可复制,避免“我感觉”、“我猜测”等主观判断。
    路径可回溯、可复制:通过量化后的结果,许多优化的方法是可以被找到原因并且可以被复制的。
    要想做到量化,需要做到三点:建立量化体系,明确量化重点和保证数据准确性。

    2.1 - 建立量化体系

    如果不能衡量,那么就不能有效增长和改进。
    需要统一标准来定义和评价,这个标准就是指标。
    具体的指标数值,可以避免“我觉得”造成的认知陷阱,“模糊虚妄”的描述会将人带入歧途。

    2.2 - 明确量化重点

    每个阶段,都应该明确当前的业务重点;量化体系需要根据业务阶段,更改量化重点及方式。
    这同时意味着:有更细节的指标及更大的监控和推广力度。
    每个阶段,都需要根据不同的业务情况来判断当前重点,从而围绕该重点建立一套无死角的分析监控体系。

    2.3 - 指标设计方法

    孤立的指标发挥不出数据的价值,需要建立结构化的指标体系。
    不同业务形态有不同的指标体系,没有放之四海而皆准的模板。
    指标的细分和拆解过程,其实对应着问题的拆分过程,应该根据具体的情况选择指标,只有选择合适的指标才能充分的反映问题。

    • 以准确和易懂为准则,集合统计学和业务效果的方法论。
    • 准确是指能够准确满足衡量目的,易懂是指标算法能直观显示好与坏,并且指标的算法也能够通俗易懂。
    • 准确是必须要保证的。

    一些用于指标设计的常用统计学工具

    • 业务概况: 平均数、中位数、众数
    • 业务差异性:方差、标准差
    • 业务分布:频数

    一些Tips

    • 比率指标:易于关注实际效果
    • 伴生指标:防止单个“片面性指标”的副作用
    • 防止坏指标:错误指标,虚荣指标(距离核心业务目标过远),复杂指标(数据波动时,很难分析原因)

    指标维度字典(Dimension Dictionary)

    • 指标维度字典,(Bus Matrix),一定程度上解决了对于指标定义不清或不统一的问题。
    • 可以对一些关键和常用的指标进行统一的维护。

    明确指标的定义和解释,要求制定者必须具备深入了解业务和拥有极高的抽象能力。
    寻找业界已有量化方法并在组织内推广,将是件事半功倍的事情。

    2.4 - 指标区分

    一个好的指标需要可量化、可测量、可以精准反馈。
    只有基于对问题的了解和思考,才能发现有价值的结论。

    “好指标”

    • 不是所有的指标都是有效的,核心驱动指标才是需要重点关注的“好指标”。
    • 简单来说,核心驱动指标和组织发展相关联,是整个运营团队、产品团队乃至研发团队在统一为之努力的目标,是一个时期/阶段内的重点方向。
    • 不同业务的核心驱动指标也不一样。
    • "好指标"应该是在有效基数上的比率或者比例,易于衡量和对比。

    “坏指标”

    • 虚荣指标:没有任何的实际意义,能够粉饰工作绩效
    • 后验性指标:时效性差,实际上只是在描述已发生事件,很难通过措施挽回成本和弥补损失
    • 复杂性指标:数据分析掉入“一堆隐藏变量指标”的陷阱中,无从下手

    2.5 - 建立正确的指标结构

    根据“指标设计方法”建立起围绕业务的指标体系。
    核心是根据业务特征确定核心指标,在核心指标的基础上以不同的角度进行拆解,然后再慢慢补充其他业务的指标情况。

    和分析思维的金字塔结构一样,拆解的过程依照金字塔方法论的“逐层拆解,不重不漏(MECE)”,指标呈现树状结构,构建核心是以业务流程为思路,以结构为导向。
    从流程的角度搭建指标框架,可以全面的囊括用户相关数据,无有遗漏。
    列举指标原则:需要有核心驱动指标。移除虚荣指标,适当的进行删减,不要为添加指标而添加指标。
    若拆解出来或业务补充的指标过多,可借鉴数据仓库的“域”概念来管理这些指标。

    3 - 数据准确性

    确保准确性的方法

    • 采取可信来源:多来源交叉确认,采用新来源时需格外小心
    • 确认加工方式:指标定义和加工算法
    • Double Check:量级,计算逻辑和业务常识

    Double Check 的技巧

    • 量级 Check:边界值,每个数据有它的大概范围
    • 计算逻辑 Check:总数、中位数、平均数等
    • 业务常识 Check:根据其他常用数字推算出该业务范围

    数据产品已经有成熟的数据质量管理方法;涉及了数据源,指标计算和数据呈现等各个环节的监控。

    4 - 沟通与反馈

    4.1 - 站在业务方的角度

    只有解决业务问题分析才能创造价值,包括个人价值和公司价值。
    “忧其所虑,给其所欲”:精准理解对方需求。

    4.2 - 主要环节

    • 沟通充分:确定业务方想要分析什么,提出更合理专业的衡量和分析方式,明确所要数据背后的含义,同时做好节点同步,切忌一条路走到黑
    • 结论简明:在阐述分析结果上,要记得结论先行,逐层讲解,再提供论据。论据上,图 > 表 > 文字
    • 提供信息量及可落地建议:从专业的角度,从已知边界向未知边界分析,提供给对方所未知的信息和可落地的建议
    • 寻求反馈:持续改进的触发点

    5 - 方式与方法

    5.1 - 数据分析方法论和数据分析法的区别

    数据分析方法论主要是从宏观角度指导如何进行数据分析,就像是一个数据分析的前期规划,指导着后期数据分析工作的开展。

    • 利用维度分析数据
    • 使用统计学知识,例如数据分布假设检验
    • 使用机器学习

    数据分析法主要从微观角度指导如何进行数据分析,是指具体的分析方法,比如对比分析、交叉分析、相关分析、回归分析等。

    5.2 - 维度分析法

    维度是描述对象的参数,在具体分析中,可以把它认为是分析事物的角度。
    有了维度后,就能够通过不同的维度组合,形成数据模型,一个多维的数据立方体。
    数据模型将复杂的数据以结构化的形式有序的组织起来。
    数据模型可以从不同的角度和层面来观察数据,这样提高了分析的灵活性,满足不同的分析需求、这个过程叫做OLAP(联机分析处理)。

    5.3 - 指标和维度有什么区别?

    维度是说明和观察事物的角度,指标是衡量数据的标准。
    维度是一个更大的范围,不只是数据,比如时间维度和城市维度,我们就无法用指标表示,而指标(留存率、跳出率、浏览时间等)却可以成为维度。
    通过业务建立和筛选出指标,将指标作为维度,利用维度进行分析,通俗理解:维度>指标。
    一般来说,指标都可以作为维度使用。

  • 相关阅读:
    路径变量@PathVariable/请求参数@RequestParam的绑定以及@RequestBody
    JSR303后端校验详细笔记
    创建ssm项目步骤
    利用 R 绘制拟合曲线
    在 Linux 中将 Caps 根据是否为修饰键分别映射到 esc 和 Ctrl
    Master Transcription Factors and Mediator Establish Super-Enhancers at Key Cell Identity Genes
    Genomic Evidence for Complex Domestication History of the Cultivated Tomato in Latin America
    Variation Revealed by SNP Genotyping and Morphology Provides Insight into the Origin of the Tomato
    The genetic, developmental, and molecular bases of fruit size and shape variation in tomato
    微信支付jsapi
  • 原文地址:https://www.cnblogs.com/anliven/p/6834083.html
Copyright © 2011-2022 走看看