zoukankan      html  css  js  c++  java
  • 数据分析工作的主要内容和基本流程

    数据分析师主要处理的几种工作内容:

    1,临时性需求(专题分析):比如说监控到现有的指标出现了异常情况,需要通过数据分析去找原因

    2,制作日常报表:日报,周报,月报,数据仪表板,等等

    3,数据挖掘:比如通过做用户分析(行为、设备、渠道、心理等等各种分析,例如:用户路径分析和转化漏斗分析),做“用户分层”,“用户分群”,在此基础上拥有较完整的“用户画像”,对用户展开有针对性的运营活动,也就是进行精细化运营

    4,战略分析:公司下达了战略目标或短期目标,需要通过数据分析看如何达成

    5,产品优化:公司要对现有的运营模式或者某个产品进行评估,看是否需要进行调整或者优化

    对于专题分析,其工作流程基本如下:

    1,明确分析目的:了解产品/运营的需求,需要解决什么问题,有哪些关键指标,并和业务方确认指标的定义(统一口径)。

    所谓问题,就是现状和期望之间的差距。这里需要判断现在的状况到底是不是一个问题。比如说某商品销售额下降了,如果该商品并不是公司的主打产品,对公司的收益未产生大的影响,那么这一现象就不是问题。相反,即使某商品销售额上升了,但是公司投入的广告费非常之多,与其销售额不符,那么这个现象就是一个问题。又比如说,虽然某商品销售额下降了,但是在可控的浮动范围内,那它就不是问题。不是说数据稍微有些变动就需要进行分析,分析之前一定要确认这到底是不是一个真正需要解决的问题。

    这里摘抄一段这个阶段可能遇到的情况:(摘自:https://posts.careerengine.us/p/5de7a5b1951eaf2c0475d960

    业务确认环节是分析师显示自身的专业能力的关键环节,也是分析任务成败的首要关键步骤。由于需求方背景不同,对于数据认知能力也参差不齐。这里面会存在几种可能:
    1. 业务方无法描述问题
    2. 业务方将很多问题混杂在一起
    3. 业务方清楚面临的问题,但无法和数据进行映射
    4. 业务方清楚面临的问题,提出了错误的数据需求
    5. 业务方无法预判可能的分析结果
    对于 1 类需求方,专业技能不合格,会祸害上下游,fire 掉就可以了,绝对不可以手软。
    对于 2 类需求方,非常普遍,因为很多人并没有经受过严格的系统化思维,分析师需要使用 MECE 原则帮助业务方梳理业务,在期间找到机会点。同时在梳理问题的同时,需要了解清楚什么是主要问题,什么是次要问题?什么是问题背后的问题?
    对于第 3 类需求方,也相对普遍,一般企业是通过角色前置来缓解这个问题,通常这个前置的角色是产品经理,不过悲剧的是前置角色可能不合格,这时又需要分析师在~数据源确认~环节给出专业建议。
    第 4 类业务方的问题和第 3 种很像,但需要单独提出来,想像一下,对方提了一个错误的数据需求,但作为分析师的你居然漂亮地执行完成了……然后业务方不满意,又提了一遍,可能还有第三遍……新手分析师应该没少吃过这个哑巴亏。
    对于第 5 类,我们实际上对业务方提出了更高的要求,这背后的逻辑有两层:
    • 业务方是否游刃有余的掌控业务和数据之间的所有可能关系;
    • 如果有和预期一致的数据分析结果,那么接下来的行动方案是否值得执行。

    2,假设问题出现的原因:这里分为两种情况,一种是验证型数据分析,也就是说可以事先假设问题出现的原因。还有一种是探索型数据分析,无法事先猜测问题可能出现的原因。

    对于验证型验证型数据分析,我们可以通过对比各维度(时间,内外部商品/服务,用户:性别,年龄,地区,兴趣广泛度,新老客户,会员非会员,交易方式。。,渠道,路径等等)的KPI来提出假设。比如说这个月和上个月相比,公司没有进行促销活动,因此可能是这个原因导致新客户人数的降低。如果通过比较未发现可能的原因,那么就需要进行探索型数据分析。大家知道,数据可以进行分析的方面太多了,如果不设限,那么数据分析可以一直深入下去,因此并不是说分析得越细越好,这样会浪费大量的时间精力,我们应该从最可能的地方入手,并随时提出假设和进行验证。

    3,准备数据:查看需要哪些数据,然后获取数据(爬虫,文件,数据库,数据仓库,市场调查,公开出版物,等等),检查所需的数据是否都有存储,清洗数据(缺失值,异常值,重复值,规范化,去除无用的信息,增加新变量,合并数据集,数据类型变换,等等),抽样,存储。

    4,分析数据:拆分指标(比如:GMV=流量*转化率*客单价),比较各个影响因素,确定影响较大并且可调控的因素,用具体分析方法对关键方向进行分析,定位到问题所在。

    5,对之前提出的假设进行验证,找到问题产生的原因。

    6,寻找可能的解决方案,并确定优先级。这里需要考虑解决方案的开发成本,时间限制,效果等因素。

    7,总结并提出建议:制作数据分析报告---报告背景,报告目的,分析思路,正文(包括数据来源,分页图表等),结论和建议。

    8,持续跟踪:运营按照解决方案更新后,收集用户反馈,不断迭代 。

  • 相关阅读:
    Python内置函数(55)——round
    Python内置函数(54)——reversed
    Python内置函数(53)——repr
    Python内置函数(52)——range
    Python内置函数(51)——property
    Python内置函数(50)——print
    Python内置函数(49)——pow
    Python内置函数(48)——ord
    Python内置函数(47)——open
    Python内置函数(46)——oct
  • 原文地址:https://www.cnblogs.com/HuZihu/p/11274171.html
Copyright © 2011-2022 走看看