zoukankan
html css js c++ java
项目总结-驱虫市场电商数据挖掘
Table of Contents
¶
1 驱虫市场潜力分析
1.1 数据处理
1.1.1 导包
1.1.2 读取数据
1.1.2.1 读取各个子类目交易额数据,合并
1.1.2.2 自定义读取单个xlsx文件的函数
1.1.2.3 读取所有文件到列表
1.1.3 依行索引(时间)将所有文件合并到一个数据框
1.1.4 清洗数据
1.1.4.1 查看缺失值占比
1.1.4.2 抽取月份以供后面索引
1.1.4.3 循环预测2018年11月和12月的销售金额
1.1.4.4 删除15年的数据
1.2 市场变化趋势描述
1.2.1 按照年份分组求每个子类目市场的交易额总额
1.2.2 处理中文字体
1.2.3 线图分析整体市场的趋势
1.2.4 各类目市场销售额趋势分析
1.2.5 灭鼠杀虫剂近三年的增量趋势
1.2.6 查看各类目市场每年总交易额占比
1.2.6.1 计算占比
1.2.6.2 图示
1.2.7 各类目市场年增幅
1.2.7.1 计算增幅
1.2.7.2 作图
1.3 市场集中度描述
1.3.1 读取对应数据,并且描述数据
1.3.2 生成交易指数占比列,用以描述市场份额
1.3.3 图形描述交易指数占比
1.3.4 计算HHI指标并打印
2 灭鼠杀虫剂市场机会点分析
2.1 数据准备
2.1.1 读取数据
2.1.2 缺失值处理
2.1.2.1 删除缺失值占比超过98%的特征
2.1.2.2 删除特征值完全一致的
2.1.2.3 依据逻辑删除不可能会用到的列,例如链接
2.1.2.4 药品登记号后的列缺失值占比高,市场分析意义不大,故都不需要
2.1.2.5 其他逻辑上不用的列
2.1.3 查看数据
2.2 细化分析
2.3 产品类别分布
2.4 灭鼠类别分析
2.4.1 依据价格划分
2.4.2 计算各价格区间的销售额,销售额占比,宝贝数,宝贝数占比,竞争度
2.4.3 定义绘图函数
2.4.4 0-50细分价格市场分析
2.5 细分市场的其他属性分析
2.5.1 店铺类型
2.5.2 型号
2.5.3 物理形态
2.5.4 物理形态,净含量
3 竞争分析
3.1 品类分布(占比)
3.1.1 数据准备
3.1.2 查看数据
3.1.3 类目
3.1.3.1 作图查看占比的不同
3.1.4 适用对象
3.1.4.1 作图
3.2 产品结构分析
3.2.1 拜耳
3.2.1.1 读数据
3.2.1.2 自定义分类汇总函数
3.2.1.3 定义盖帽法函数(只考虑右边的尾巴盖帽)
3.2.1.4 分别定义对两个指标盖帽的函数
3.2.1.5 定义作图函数
3.2.1.6 拜耳明星产品
3.2.1.7 拜耳问题产品/潜力款
3.2.2 安速
3.2.2.1 读数据
3.2.2.2 汇总指标
3.2.2.3 盖帽法处理
3.2.2.4 BCG图
3.2.2.5 查看具体产品
3.2.2.6 安速明星
3.2.2.7 安速奶牛
3.2.2.8 安速问题
3.2.3 科凌虫控
3.2.3.1 读数据
3.2.3.2 汇总指标
3.2.3.3 盖帽
3.2.3.4 作图
3.2.3.5 查看具体产品
3.2.3.6 科凌虫控明星
3.2.3.7 科凌虫控奶牛
3.2.3.8 科凌虫控问题
3.3 流量结构分析
3.3.1 数据准备
3.3.2 拜耳
3.3.2.1 排名前10的详细数据
3.3.3 安速
3.3.4 科凌虫控
3.4 舆情分析
3.4.1 数据准备
3.4.1.1 抽评论列
3.4.1.2 去掉非英文字符
3.4.1.3 读取构建停用词列表
3.4.1.4 组合多个列表到一个列表
3.4.1.5 计算词频
3.4.1.6 组合多个字符为长字符
3.4.1.7 绘制词云图
3.4.1.8 写出词云图
3.4.1.9 基于TF-IDF 算法的关键词抽取
详情见项目链接:
https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/电商文本挖掘.ipynb
查看全文
相关阅读:
第一次迭代心得
RDF搜索引擎——需求分析心得
RDF搜索引擎——数据库设计心得
RDF搜索引擎——数据库具体设计
服务器上修改运行scala
结对编程项目的收获与总结(支持UI背景与背景音乐的刷题器)
取长补短——结对编程项目之队友代码分析
团队项目——测试心得
第一次迭代开发心得
团队项目——需求心得
原文地址:https://www.cnblogs.com/lvzw/p/11558338.html
最新文章
代码执行效率调优(一)
基于.NET网页开发的工作,需要掌握的知识点
vscode中将本地数据push至git repository
前端工具
NodeJS&&前端思考
ASP.NET相关事件及JS的执行顺序
Python冒泡排序
orcal数据库基础1
需求管理
测试基础
热门文章
oa项目部署和总结
排序
TensorFlow中tf.nn模块
自适应控制笔记
LeetCode
Pandas学习笔记
tensorflow中padding规则
Numpy函数集合
基于TensorFlow简单实现手写体数字识别
tensorflow常见函数
Copyright © 2011-2022 走看看