zoukankan
html css js c++ java
项目总结-驱虫市场电商数据挖掘
Table of Contents
¶
1 驱虫市场潜力分析
1.1 数据处理
1.1.1 导包
1.1.2 读取数据
1.1.2.1 读取各个子类目交易额数据,合并
1.1.2.2 自定义读取单个xlsx文件的函数
1.1.2.3 读取所有文件到列表
1.1.3 依行索引(时间)将所有文件合并到一个数据框
1.1.4 清洗数据
1.1.4.1 查看缺失值占比
1.1.4.2 抽取月份以供后面索引
1.1.4.3 循环预测2018年11月和12月的销售金额
1.1.4.4 删除15年的数据
1.2 市场变化趋势描述
1.2.1 按照年份分组求每个子类目市场的交易额总额
1.2.2 处理中文字体
1.2.3 线图分析整体市场的趋势
1.2.4 各类目市场销售额趋势分析
1.2.5 灭鼠杀虫剂近三年的增量趋势
1.2.6 查看各类目市场每年总交易额占比
1.2.6.1 计算占比
1.2.6.2 图示
1.2.7 各类目市场年增幅
1.2.7.1 计算增幅
1.2.7.2 作图
1.3 市场集中度描述
1.3.1 读取对应数据,并且描述数据
1.3.2 生成交易指数占比列,用以描述市场份额
1.3.3 图形描述交易指数占比
1.3.4 计算HHI指标并打印
2 灭鼠杀虫剂市场机会点分析
2.1 数据准备
2.1.1 读取数据
2.1.2 缺失值处理
2.1.2.1 删除缺失值占比超过98%的特征
2.1.2.2 删除特征值完全一致的
2.1.2.3 依据逻辑删除不可能会用到的列,例如链接
2.1.2.4 药品登记号后的列缺失值占比高,市场分析意义不大,故都不需要
2.1.2.5 其他逻辑上不用的列
2.1.3 查看数据
2.2 细化分析
2.3 产品类别分布
2.4 灭鼠类别分析
2.4.1 依据价格划分
2.4.2 计算各价格区间的销售额,销售额占比,宝贝数,宝贝数占比,竞争度
2.4.3 定义绘图函数
2.4.4 0-50细分价格市场分析
2.5 细分市场的其他属性分析
2.5.1 店铺类型
2.5.2 型号
2.5.3 物理形态
2.5.4 物理形态,净含量
3 竞争分析
3.1 品类分布(占比)
3.1.1 数据准备
3.1.2 查看数据
3.1.3 类目
3.1.3.1 作图查看占比的不同
3.1.4 适用对象
3.1.4.1 作图
3.2 产品结构分析
3.2.1 拜耳
3.2.1.1 读数据
3.2.1.2 自定义分类汇总函数
3.2.1.3 定义盖帽法函数(只考虑右边的尾巴盖帽)
3.2.1.4 分别定义对两个指标盖帽的函数
3.2.1.5 定义作图函数
3.2.1.6 拜耳明星产品
3.2.1.7 拜耳问题产品/潜力款
3.2.2 安速
3.2.2.1 读数据
3.2.2.2 汇总指标
3.2.2.3 盖帽法处理
3.2.2.4 BCG图
3.2.2.5 查看具体产品
3.2.2.6 安速明星
3.2.2.7 安速奶牛
3.2.2.8 安速问题
3.2.3 科凌虫控
3.2.3.1 读数据
3.2.3.2 汇总指标
3.2.3.3 盖帽
3.2.3.4 作图
3.2.3.5 查看具体产品
3.2.3.6 科凌虫控明星
3.2.3.7 科凌虫控奶牛
3.2.3.8 科凌虫控问题
3.3 流量结构分析
3.3.1 数据准备
3.3.2 拜耳
3.3.2.1 排名前10的详细数据
3.3.3 安速
3.3.4 科凌虫控
3.4 舆情分析
3.4.1 数据准备
3.4.1.1 抽评论列
3.4.1.2 去掉非英文字符
3.4.1.3 读取构建停用词列表
3.4.1.4 组合多个列表到一个列表
3.4.1.5 计算词频
3.4.1.6 组合多个字符为长字符
3.4.1.7 绘制词云图
3.4.1.8 写出词云图
3.4.1.9 基于TF-IDF 算法的关键词抽取
详情见项目链接:
https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/电商文本挖掘.ipynb
查看全文
相关阅读:
Keil MDK中的Code, RO-data , RW-data, ZI-data分别代表什么意思?(转)
nrf开发笔记一开发软件
ARM CORTEX-M3的时钟
stm32之Cortex系统定时器(SysTick)
micrium ucprobe使用笔记
C语言结构体初始化的四种方法(转载)
setsockopt的作用
Java之RandomAccessFile小结
疯狂JAVA讲义---第十五章:输入输出(上)流的处理和文件
java压缩解压zip文件,中文乱码还需要ant.jar包
原文地址:https://www.cnblogs.com/lvzw/p/11558338.html
最新文章
使用RabbitMQ放置自己定义对象(不借助序列化工具,比如protobuffer)V2.0
cocos2d-x 3.0游戏实例学习笔记《卡牌塔防》第0步---知识点总结&效果预览&设计思路
考勤补卡
C++求解汉字字符串的最长公共子序列 动态规划
Jquery-Uncaught ReferenceError: $ is not defined报错
深入理解 C 指针阅读笔记 -- 第二章
改变placeholder颜色
express快速搭建web server
JavaScript的继承
javascript 数据类型判断
热门文章
防止ajax请求重发
mouseover和mouseout闪烁问题
table设置滚动条
移动端页面模板
virtualbox
centos命令
nrf52裸机学习——GPIO操作
nrf52810学习笔记——二
nRF52-PCA10040——Overview
Developing for nRF52810(转载)
Copyright © 2011-2022 走看看