zoukankan      html  css  js  c++  java
  • 实战案例:电商数据分析

    随着国家开放二胎政策,婴儿市场规模也在不断的扩大,根据淘宝天猫的婴儿用品购买情况,对产品进行多维度分析,分析市场需求,定位产品方向,从而在满足市场需求的同时,提高销量。

    1.理解数据

    数据源来自阿里天池:<

    包含两张表,购买商品表和婴儿信息表

    购买商品表字段信息:用户ID 商品ID 商品二级分类 商品一级分类 商品属性 购买数量 购买日期

    婴儿信息表字段信息:用户ID 出生日期 性别

    2.提出问题

    相关指标

    提出问题

    1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?

    2.哪类商品最热销,可主推?

    3.用户年龄段、性别对于销量的影响?如何做到精准营销?

    分析思路

    3.数据清洗

    选择子集

    考虑到属性字段,都是一些编号,没办法具体分析,因此去除该字段

    列名重命名

    这里把英文名改成中文名称

    一致化处理

    两张表都需要对日期进行处理,转换成标准的日期格式,text函数进行格式化统一

    也可以采用分列的形式进行

    数据整合

    使用vlookup,根据用户id,匹配婴儿相关信息,但是整合后发现有很多数据无法匹配到婴儿信息,因此在后续关于婴儿相关分析的时候只会提取能匹配上的部分数据

    异常值处理

    关于婴儿性别,0代表女,1代表男,2代表未知,要对2的异常数据进行处理,这里按照男女比例进行大概处理,

    男女比例为:438:489 ,总共26个异常值,因此把12个替换成1,14个替换成0

    利用if函数替换成男和女

    4.数据分析

    1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?

    1.首先,对销量进行多维度拆解,分成【新用户购买量】 和 【老用户购买量】,分别进行分析,但是经过计算,该测试数据,老用户的复购率特别低,因此可以忽略,直接从新用户购买数量,在时间维度上进行分析。

    下图是商品的总体走势

    接下来我们看看每年的每个月的走势对比

    通过走势分析发现,在每年的5月,9月,11月都有不同程度的高峰凸起,整体呈现上涨趋势,接下来分析,为什么销量上涨,

    2.这里可以采用4P营销理论,利用假设检验法,分别从产品、价格、渠道、宣传,四个方面进行分析。

    产品维度

    假设:新增产品类带来销量的上升

    收集证据:下面是每年各月的二级分类商品数目对比

    可以看出,2014年在5月,11月商品数目有所增加,2013年和2012年有缓慢的上升趋势,但是由于这个是订单数据,这些商品也只是获取的购买到的商品数目,所以不太准确,建议可根据公司实际市场部的商品数据进行二次验证,因此假设不成立。

    价格维度

    假设:降价带来的销量上涨

    收集证据:

    由于案例中没有涉及到价格相关数据,因此假定平均价格保持稳定,对销量影响不大,因此假设不成立。

    渠道维度

    假设:新增渠道带来销量上涨

    收集证据:

    根据每年个月的走势图,我们发现,仅仅是在5,9,11存在波峰,之后前后月份都会有所下降,所以如果是渠道增加,应该是一个持续上涨的趋势,所以推断假设不成立,案例中没有相关数据,实际工作中,可获取渠道数据进行验证,所以,在本案例中,假设不成立。

    宣传维度

    宣传维度主要包括品牌宣传,公关,促销等,这里只分析促销

    假设:由于促销活动带来销量上涨

    收集证据:

    先看5月数据

    从图中可以看出2014年在5月3日,5月12日,5月22日都有明显的波动,特别是在5月22日,核证后,5月1日-5月3日(劳动节)、5月11日(母亲节)及5月20日(表白节)淘宝天猫均做促销;13年5月数据在5月3号,5月10号和5月20号也都有所上涨,说明受到节日促销的可能性很大。

    接下来再看9月数据

    2014年在9月20号达到一个很大的波峰,2012年和2013年也有不同程度的波峰,考虑到每年的9月都会有中秋的节日,可能会不定期搞促销活动,但是9月20日并没有什么节假日或者活动日,经核查,有一笔订单,一次性订购了2748件,属于偶然事件,不作为分析范围。

    再来看11月数据

    这个就很明显啦,双十一活动带来的影响,只是时间是在11月13日,而非11月11日,这个需要跟相关部门沟通一下,是不是促销时间调整的问题。

    2012年在11月10日和11月19日出现高峰,2013年在11月11日和11月29日出现高峰,2014年是在11月13日出现高峰,很明显是双十一促销带来的影响。

    因此,对于促销活动带动销量的假设成立。

    总结:促销销量增长的原因,一是促销活动带来非常好的效果,二是商品数目的增加也在一定程度上促进了销量增长,但是对于产品促销,在实际工作中,还需要进一步考虑成本问题,对于ROI的把控,一味的促销是不可取的,

    2.如何进行有效的促销?

    可以从以下两个方面

    - 主推热销产品

    热销产品,这边定义为下单次数多的商品,如果从订单量考虑的话,会出现一次性购买很多的现象,下单次数多,代表大家对该产品都喜爱,这才是热销

    从图中可以看出 68结尾的商品,订单量是最大的,但是销量低于28产品,按照我们对于热销产品的定义,50008168为热销产品,这是商品一级分类,接下来分析该商品类下的二级分类订单量情况。

    接下来再看看该商品类在时间轴上的订单变化趋势

    可以看出50013636类的商品,订单量最高,而且从时间上看,在几次的促销活动中,它都有出色的表现,说明该商品类是热销产品,那就可以考虑,对该产品进行重点评估,下次的促销活动能够选择该商品类下的部分商品。

    - 针对不同用户群体,精准营销

    • 不同年龄

    这边计算的是购买商品时婴儿的年龄,根据购买时间-出生时间,但是中间会存在负值的现象,是因为有一些用品是在宝宝出生前提前购买好的,这里的年龄是四舍五入取整的,0岁代表了一部分即将出生的婴儿和刚出生不久的婴儿,另外婴儿用品,一般作为家长的喜欢囤,所以这个只是估算婴儿的年龄来做的分析。

    可以看出,婴儿用品大部分集中在0岁到1岁之间,这里1代表的是半岁到1岁半之间的,0代表的是出生前后半岁的,那说明婴儿在出生前到1岁半之间购买量是最大的,并且对于15结尾的产品在0和1之间需求量很大,28和68产品有生前预购。

    接下来看看不同性别对于销量的影响

    可以看出,女婴在1岁左右对于15结尾类商品需求量比较大,男婴在0-2岁对于68结尾的商品比较大,并且在0-1岁对各类商品的需求都不少。

    • 不同性别

     

    可见女婴的购买力明显高于男生,因为2015年只有两个月的数据,所以不参与对比,从整体上销量随着时间的变化呈现上升趋势,说明母婴市场发展良好。

    男婴和女婴对于商品类的偏好

    可以看出女婴对于15结尾类的商品购买量比较突出,男婴对于68结尾类的商品购买量相对较高,针对女婴,可以考虑对15结尾类商品的大力推广,68结尾类商品需求男女都有,说明是刚需,可以考虑通过更多的数据去分析相关性,搭配套餐带动其他产品的促销活动。

    结论与建议:

    1.促销活动一定要有针对性,50013636类商品是热销商品,评估后,可以采取相应的促销手段。

    2.精准营销,针对需求的多少去针对性推送广告以此来减免广告费用,提高广告效率,对于女婴产品可以集中在1岁进行15结尾类的商品进行推广,男婴产品可以在0-2岁集中推广。

    3.推广渠道按照年龄划分,如果需求量在0-1岁比较大,线上推广可以结合母婴类APP在不同模块和功能点处进行针对性推广。

    4.对于28的商品类和68结尾的商品类销量最大,可以进行大力的宣传和推广,在保证产品质量的同时提高产品的销量。

     

    这只是简单 思路 ,大家可以 根据自己的想法,利用之前的分析方法进行不同角度的分析练习。

  • 相关阅读:
    tar命令,vi编辑器
    Linux命令、权限
    Color Transfer between Images code实现
    利用Eclipse使用Java OpenCV(Using OpenCV Java with Eclipse)
    Matrix Factorization SVD 矩阵分解
    ZOJ Problem Set
    Machine Learning
    ZOJ Problem Set
    ZOJ Problem Set
    ZOJ Problem Set
  • 原文地址:https://www.cnblogs.com/bubu99/p/13651571.html
Copyright © 2011-2022 走看看