zoukankan      html  css  js  c++  java
  • 数据分析的理念、流程、方法、工具

    本文将对数据分析的关键知识模块做介绍,可以为你解答以下问题:

    为什么要做数据分析?

    数据如何驱动运营?

    数据分析的指标有哪些?

    数据分析的模型有哪些?

    怎么评估用户价值?

    数据分析报告怎么写?

    数据可视化工具 ...

     一、数据的价值

    (一) 数据驱动企业运营

    从电商平台的「猜你喜欢」到音乐平台的「心动模式」,大数据已经渗透到了我们生活的每一个场景。不论是互联网行业,还是零售业、制造业等,各行各业都在依托互联网大数据(数据采集、数据存储、数据处理、数据挖掘、数据分析、数据呈现)实现企业价值。

     

    企业中数据从产生到应用依次要经过数据源层、数据仓库层、数据建模层,最后到数据应用层,经过层层加工逐渐支持到上游的应用环节。

    数据分析的理念、流程、方法、工具

     

    数据应用层是数据产生价值的出口,通过数据挖掘、用户画像建模、推荐算法的制定,可实现千人千面的个性化内容推荐。「个性化」内涵是内容与用户的高度匹配,以达到提升体验、提升高黏性、促进销售转化的目的。

    (二)数据驱动产品运营

    数据分析对业务发展、产品优化、精细化运营也起到了关键支持。

    数据驱动产品、数据驱动运营的关键在于「可以通过数据分析提出产品优化思路,提出运营提升的举措,快速上线验证效果,重新优化,进入新的增长循环」。

    数据运营的关键应用场景有:

    • 评估产品改版(新功能)效果
    • 发现产品改进关键点
    • 构建用户画像,以便开展精细化运营
    • 优化用户体验
    • 发现业务运营中存在的问题
    • 运营效果分析、ROI分析
    • 数据总结与向上汇报

    ......

     二、如何用数据驱动运营

    (一)数据驱动运营的内涵

    数据驱动运营是一个很宽泛的概念,但拆分下来,数据驱动运营有三个内涵:

    • 产品运营人员要具备数据意识,通过数据发现问题
    • 产品运营人员可以通过数据管理本职工作,用数据解决问题
    • 让数据说话,提高各部门的沟通效率

    (二)数据驱动运营的工作流程

    数据分析的理念、流程、方法、工具

     

    1. 定义数据分析目标

    明确目标,意味着运营人员(或数据分析师)要站在数据结果输出对象的角度去思考。

     

    对于管理层来说,往往会关注以下几个结果:

    • 重大决策最终反应在了哪些指标上
    • 这些指标有什么关联
    • 业务全局有什么变化趋势
    • 与过去相比,哪些进步了,哪些退步了
    • 数据暴露出了什么问题,需要做什么调整

    产品运营人员则更关注细节。整体来看,运营数据分析的目标主要有三类——即「解决是什么、为什么、做什么」的问题,具体的数据分析目标还要结合实际工作来定义:

    • 是什么:如运营举措的效果如何?产品优化的效果如何?用户使用情况是怎样的?用户的体验反馈如何?
    • 为什么:如转化率为什么提升/降低?用户为什么会产生意料之外的行为?运营举措和产品优化为什么有效/没有效果?
    • 做什么:如运营策略该如何调整?产品该怎么优化?业务战略该怎么调整?

    2. 数据指标拆解

    在确定了分析目标后,就需要进行数据指标拆解。明确要分析哪些具体的数据指标,为了避免遗漏关键细节,可以先对业务(或某一个活动、使用场景)流程做梳理,得出每一个节点的数据指标项,根据分析目标需要,保留关键项,剔除多余项。

    3. 数据采集

    • 定义数据源:在分析数据之前,要对数据来源、统计口径、统计周期加以定义,以便提交「数据提取」需求。
    • 数据的获取途径:数据来源包括埋点数据、运营平台、业务平台、第三方平台、回访调研等。运营人员要对不同数据源的真实性、准确性做把关。

    4. 数据可视化

    使用图表工具,将数据可视化,更容易发现数据的趋势、极值、联系。不同图表类型适用于不同的分析场景。

    散点图:用于描述数据之间的规律

    折线图:描述数据随着时间变化的趋势

    面积图:折线图的延伸,更注重数据和时间趋势的变化关系

    柱形图:类别之间的关系

    饼状图:数据之间的占比

    漏斗图:转化率分析、占比分析

    雷达图:个体数据的属性和可视化,常用于用户画像、CRM

    树形图:适合数据量大、类别多的情况,比如各类电商的SKU

    桑基图:解释数据复杂变化的趋势,一对多或者多对一

    热力图:属性和维度的规律组合,有点像折线图

    关系图:不同种类的关系,常用于社交媒体

    箱线图:统计学图表,用于研究和观察数据分布,对比数据分布等

    标靶图:用于业务销售完成情况等

    词云图:文本分析利器

    地理图:数据和空间的关系

    数据分析的理念、流程、方法、工具

     

    5. 数据分析

    解决问题是数据分析的最终落脚点。这一环节的目标是发现数据的特征、规律、数据之间的关联,通过对数据的洞察解决实际问题。

    6. 输出数据分析结论

    数据分析的结果可以根据需要以Word或PPT的形式呈现。

    报告应采取总分总的格式:

    • 总述:阐述数据分析的背景、目的、目标、分析思路、目录、关键发现。
    • 分述:对业务按多维度细分分析,用数据图表与相应结论阐述观点。
    • 总结:提出结论与优化建议、行动计划、对业务发展做预测,提出策略与结论、附录。

    根据实际工作需要,「报告」不一定是必须的,数据分析的结果是为了下一步的行动计划作支撑。

    7. 测试验证

    根据数据分析结论,按照计划开展优化测试,对测试效果展开分析,以此开启新的数据分析进程,形成数据分析工作的闭环。

     三、数据分析的基本指标

     

    (一) 基础数据指标

    基础数据指标参考了增长黑客理论中的AARRR模型,针对用户从新增到流失的多个环节,来定义相应指标。

    • 新增:日/周/月新增。

    这里有两个维度,增量与增速。新增用户增速是产品增长的基础

    • 传播:病毒系数、传播周期。

    平均每位老用户会带来几位新用户?大于 1 的时候,产品才可能出现爆发式的指数增长。

    老用户一般在注册(新增)后多长时间带来新用户?传播周期越短,增长速度越快。

    • 活跃:活跃用户数DAU/MAU。

    只有活跃用户才能为产品带来价值。

    • 留存:留存率:次日、周、月。

    使用产品的时间越久(活的长久),对产品的潜在价值越大

    留存的计算业内有多种方式,但大多数采用了下方的计算公式:

    次日留存率=(当天新增的用户中,第2天还登录的用户数)/第一天新增用户总数;

    七日留存率=(第一天新增的用户中,在往后的第7天还有登录的用户数)/第一天新增总用户数;

    月留存率=(第一天新增的用户中,在往后30天还有登录的用户数)/第一天新增总用户数

    • 流失:流失率。

    一段时间内流失的用户,占这段时间活跃用户数的比例。只有当产品新用户增长的速度大于老用户流失的速度时,产品的活跃用户数才会是正增长。

    (二)用户行为数据指标

    另一个维度,立足于用户行为,可以根据提升黏性、提升参与度、提升转化这三个目标定义具体的数据指标。

    • 黏性指标:留存率、周活天

    留存率反应产品是否满足用户需要。周活天反应用户忠诚度。

    • 参与度指标:活跃度、停留时长、访问页面数量
    • 转化指标:用户从上一环节到下一环节的转化率

    这两种指标体系都具有参考价值,可以根据自身实际情况适当组合。

     四、用户分群

    (一)用户分群

    用户分群是精细化运营的基础要求,也是数据分析的最基础方式。对用户进行分群,能帮助我们了解每个细分群体用户的变化情况,进而了解用户的整体现状及发展趋势。同时,由于运营资源本身有限,不可能真的做到一对一的个性化运营,但针对群体的运营是十分必要的。

    (二)用户分群模型

    用户分群的首要任务是根据具体的业务场景,确定不同的分类规则,给出清晰的定义。

    1. AARRR模型分群法

    借鉴增长黑客AARRR模型,可以把用户分为:

    • 注册用户:通过不同获客渠道完成注册的用户。
    • 活跃用户:注册且登陆的用户。
    • 留存用户:一定时间内未流失的用户。
    • 下单用户:对营收产生价值的用户。
    • 忠诚用户:对产品高度认同及依赖的用户。

    2. RFM模型分群法

    (1)RFM模型——用于建立分群维度

    传统行业对用户分类最常用的方法是RFM模型,RFM分别是三个英文单词的首字母。

    • R(Recency)代表消费新鲜度。理论上,最近一次消费时间越近,说明此用户相对来说是比较优质的用户,对提供即时的商品或者服务,他们是最可能及时响应的。
    • F(Frequency)代表消费频率。是用户在某段时间内购买商品或服务的次数。一般来说,消费频率越大,顾客忠诚度越高。
    • M(Monetary)代表消费金额。消费金额体现用户的消费能力。

    (2)用户五等分模型——用于明确分群规则

    美国数据库营销研究所Arthur Hughes用户五等分模型,将指标按下列规则分类:

    1)查询近一个月(查询时间往前推30天)所有内容创建者最近一次的登录时间。

    2)按最近一次登录时间距离查询当日的时间排序:前20%标记为R5,记为5分;前20%~40%,标记为R4,记为4分;前40%~60%,标记为R3,记为3分;前60%~80%,标记为R2,记为2分;前80%~100%,标记为R1,记为1分。依此类推,将创建内容的用户分成五等分。

    3)查询出内容用户在一个月内登录的天数,及创建的内容数,按同样的方法五等分进行标记。

    4)将R5、F5、M5等同于5分,R4、F4、M4等同于4分,R1、F1、M1等同于1分,将每个顾客对应的三个数字相加,作为内容提供用户价值的得分。

    (3)RFM模型分群法的应用

    1)细分用户群分析

    对某个或某几个用户分群进行分析,从而给出具有针对性的运营建议。如对R1、R2的用户进行分析,找到活跃用户的共性,从而反推用户不活跃或流失的原因。

    2)顾客价值评估

    基于用户五等分模型,对用户进行价值评估。在资源有限的情况下,可以优先满足10分以上高价值用户的需求,同时通过完善权益机制,激励9分以下的低价值用户升级,引导整个用户体系的良性发展。

    用户价值划分:

    3~5分:低贡献用户

    6~9分:一般用户

    10~13分:优质用户

    14~15分:高价值用户

    3)流失用户监控

    基于R、M两个维度,对不同分值用户打上标签,区分出高价值忠诚用户、高价值流失用户等,以便展开具体的运营举措。

    R≥3且M<3,打上标签:低价值忠诚用户。

    R≥3且M≥3,打上标签:高价值忠诚用户。

    R<3且M<3,打上标签:低价值流失用户。

    R<3且M≥3,打上标签:高价值流失用户。

    数据分析的理念、流程、方法、工具

     

    3. 关于「同期群」

    同期群是一种用户分群的方式,按用户的新增时间将用户分群,得到的每个群叫一个同期群。

    由于同一项产品改进对不同同期群中的用户产生的影响是不同的,分开衡量才更能反映真实的情况,因此,我们常常会进行同期群分析。同期群分析是指将用户进行同期群划分以后,分析和对比不同同期群组用户的相同指标。

     五、数据分析模型

    很多时候我们听到「模型」两个字都会觉得高深莫测,当然也有不少人会对这种「学院派」的做法嗤之以鼻。但实际上,模型只是「对数据分析思路的抽象」,通过模型能快速帮助我们梳理思路,理清数据的内在关联。

    数据分析模型有很多种类,本文里我们不涉及技术,只对关键的逻辑模型做重点说明:

    挖掘算法模型:主要是针对具体的业务问题,通过数学算法等方式输出计算结果,如预测、聚类、文本挖掘。

    数据库模型:结合业务对底层数据进行整合

    逻辑模型:是指通过一些指标的内在联系组合起来的可分析问题的模型。比如RFM模型以及「增长黑客」中常用的AARRR模型。

    关于「增长黑客」的理论、方法、工具等内容,我们将在后续文章中详细介绍。

    1. 4P营销理论(适用于业务整体分析)

    4P营销理论是密西根大学教授杰罗姆·麦卡锡(E.Jerome Mccarthy)在20世纪60年代提出的。这个理论将营销组合的要素分为产品(Product)、价格(Price)、促销(Promotion)、渠道(Place)四要素,使得营销简化并方便记忆和传播。

    • 产品:在产品维度,侧重回答我们的产品是什么?是否实现盈利?产品如何满足用户需求?产品的目标用户是谁?产品的优化是否有效?存在什么问题?

    通常我们理解的产品是有形的,但实际上这是狭隘的观点。实际上产品可以是任何在市场存活的,满足用户某种需求的东西,它可以是实物,也可以是服务、人员、技术、组织、智慧等或以上若干种的组合。

    • 价格:在价格维度,侧重分析产品如何定价?收入情况如何?ROI如何?哪些环节会影响到收入?
    • 促销:促销维度则关注促销方式是什么,效果怎么样?
    • 渠道:渠道质量如何?渠道覆盖如何?用户的渠道偏好是怎样的?

    2. 5W2H(适用于向领导汇报数据分析计划)

    5W2H是以5个以W开头的英文单词及2个以H开头的英文单词为缩写的简称,使用5W2H分析方法能很清晰地知道需要往哪些方面去思考和展开分析,帮助理清分析思绪。

    • What:数据分析的对象是什么?
    • Why:数据分析的背景是什么,为什么要做这次数据分析?
    • Where:数据源是什么?
    • When:数据采集时段是多久?
    • Who:谁来执行具体的数据环节?
    • How:如何执行?
    • How much:需要投入什么资源?

    3. 其他模型

    • PEST:适用于宏观环境的分析。
    • SWOT:适用于做战略分析。

     六、用户生命周期价值

    1. 用户终生价值的计算 (life time value)

    LTV =(某个客户每个月的下单频次*客单价*毛利率)*(1 /月流失率)=(某个客户每个月的下单频次* ARPU *毛利率)*(1 /(1-月留存率))=用户生命周期内下单次数*客单价*毛利率

    1)ARPU值的计算

    ARPU(每个用户的平均收入)=某段时间内的总收入/同时期内活跃用户总数;

    2)流失率的计算

    流失率指的是一段时间内,有多少比例的用户不再使用你的产品了。所以流失率=在某段时间内流失的用户/同时期内活跃的用户,流失比较难定义,但留存比较好定义,故月流失率近似等价于1-月留存率;流失率的倒数用来表示预测的用户生命周期,如果一个产品的流失率为10%,则产品对应的生命周期为10个月。

    2. 应用场景

    1)评估运营活动是否盈利

    单个用户毛利=用户生命周期价值-获取用户成本-运营成本= CLV - CAC - COC

    很多产品在初期一直以补贴用户的形式来留住用户,长此以往,资金链一旦断裂,将无以为继。只有当用户的毛利大于0时,产品才能良性地、持续稳健地发展下去。

    2)追踪投资回报率

    计算公式:ROI =转化率* ARPU/ (CAC + COC)

     七、数据指标的拆解

    作为运营负责人,常常面临分工不明确,考核难量化等问题。

    将KPI进行拆解也是常见的分析方法,其核心思想是将KPI指标(如营收)拆解到各个业务线去,再由各业务线进行二次拆分。

    为了促进流量运营、用户运营、内容运营等各运营团队之间的协作,可以将营业收入KPI以乘积的方式分解成各运营团队的KPI,各团队不仅需要完成各自KPI还需要相互合作才能完成共同KPI,有效减少了团队间的内耗。

    例如,若整个大部门背负着收入指标,则根据计算公式:收入=客单价*付费用户数=客单价*用户数*付费转化率,可以将客单价、付费转化率、用户数作为不同小团队的KPI。

     八、数据可视化工具推荐

    网络上可搜寻到的数据可视化工具非常多,在数据图表制作、平台操作上也大多相似,但也各有特点,可以根据展示效果需要来选择工具。

    1)花火Hanabi

    可制作数据动图、短视频素材

    2)镝数图表

    除了数据图表制作外,有大量模版,可以制作数据展示的海报、长图文

    3)图表秀

    可制作PPT格式的数据分析报告、制作在线数据网站(包含点击交互效果)

    4)思迈特Smartbi

    企业数据分析BI解决方案

    5)Datawrapper

    适合外企,可制作图表、地图、报告,支持导出链接、pdf等格式

  • 相关阅读:
    Redis 介绍1
    浅议javascript的内存泄露
    Redis 介绍2——常见基本类型
    常见的排序算法二——希尔排序
    Mono 学习之旅二
    Mono 学习之旅一
    常见的排序算法三——冒泡排序
    微软的面试题
    八大排序算法总结 1直接插入排序
    windows phone7 项目一俄罗斯方块源码 及说明
  • 原文地址:https://www.cnblogs.com/IT-Evan/p/14365477.html
Copyright © 2011-2022 走看看