zoukankan
html css js c++ java
项目总结-驱虫市场电商数据挖掘
Table of Contents
¶
1 驱虫市场潜力分析
1.1 数据处理
1.1.1 导包
1.1.2 读取数据
1.1.2.1 读取各个子类目交易额数据,合并
1.1.2.2 自定义读取单个xlsx文件的函数
1.1.2.3 读取所有文件到列表
1.1.3 依行索引(时间)将所有文件合并到一个数据框
1.1.4 清洗数据
1.1.4.1 查看缺失值占比
1.1.4.2 抽取月份以供后面索引
1.1.4.3 循环预测2018年11月和12月的销售金额
1.1.4.4 删除15年的数据
1.2 市场变化趋势描述
1.2.1 按照年份分组求每个子类目市场的交易额总额
1.2.2 处理中文字体
1.2.3 线图分析整体市场的趋势
1.2.4 各类目市场销售额趋势分析
1.2.5 灭鼠杀虫剂近三年的增量趋势
1.2.6 查看各类目市场每年总交易额占比
1.2.6.1 计算占比
1.2.6.2 图示
1.2.7 各类目市场年增幅
1.2.7.1 计算增幅
1.2.7.2 作图
1.3 市场集中度描述
1.3.1 读取对应数据,并且描述数据
1.3.2 生成交易指数占比列,用以描述市场份额
1.3.3 图形描述交易指数占比
1.3.4 计算HHI指标并打印
2 灭鼠杀虫剂市场机会点分析
2.1 数据准备
2.1.1 读取数据
2.1.2 缺失值处理
2.1.2.1 删除缺失值占比超过98%的特征
2.1.2.2 删除特征值完全一致的
2.1.2.3 依据逻辑删除不可能会用到的列,例如链接
2.1.2.4 药品登记号后的列缺失值占比高,市场分析意义不大,故都不需要
2.1.2.5 其他逻辑上不用的列
2.1.3 查看数据
2.2 细化分析
2.3 产品类别分布
2.4 灭鼠类别分析
2.4.1 依据价格划分
2.4.2 计算各价格区间的销售额,销售额占比,宝贝数,宝贝数占比,竞争度
2.4.3 定义绘图函数
2.4.4 0-50细分价格市场分析
2.5 细分市场的其他属性分析
2.5.1 店铺类型
2.5.2 型号
2.5.3 物理形态
2.5.4 物理形态,净含量
3 竞争分析
3.1 品类分布(占比)
3.1.1 数据准备
3.1.2 查看数据
3.1.3 类目
3.1.3.1 作图查看占比的不同
3.1.4 适用对象
3.1.4.1 作图
3.2 产品结构分析
3.2.1 拜耳
3.2.1.1 读数据
3.2.1.2 自定义分类汇总函数
3.2.1.3 定义盖帽法函数(只考虑右边的尾巴盖帽)
3.2.1.4 分别定义对两个指标盖帽的函数
3.2.1.5 定义作图函数
3.2.1.6 拜耳明星产品
3.2.1.7 拜耳问题产品/潜力款
3.2.2 安速
3.2.2.1 读数据
3.2.2.2 汇总指标
3.2.2.3 盖帽法处理
3.2.2.4 BCG图
3.2.2.5 查看具体产品
3.2.2.6 安速明星
3.2.2.7 安速奶牛
3.2.2.8 安速问题
3.2.3 科凌虫控
3.2.3.1 读数据
3.2.3.2 汇总指标
3.2.3.3 盖帽
3.2.3.4 作图
3.2.3.5 查看具体产品
3.2.3.6 科凌虫控明星
3.2.3.7 科凌虫控奶牛
3.2.3.8 科凌虫控问题
3.3 流量结构分析
3.3.1 数据准备
3.3.2 拜耳
3.3.2.1 排名前10的详细数据
3.3.3 安速
3.3.4 科凌虫控
3.4 舆情分析
3.4.1 数据准备
3.4.1.1 抽评论列
3.4.1.2 去掉非英文字符
3.4.1.3 读取构建停用词列表
3.4.1.4 组合多个列表到一个列表
3.4.1.5 计算词频
3.4.1.6 组合多个字符为长字符
3.4.1.7 绘制词云图
3.4.1.8 写出词云图
3.4.1.9 基于TF-IDF 算法的关键词抽取
详情见项目链接:
https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/电商文本挖掘.ipynb
查看全文
相关阅读:
matlab基本数据结构struct
matlab基本函数strcmp num2str 字符串格式
matlab基本函数inf, isempty, round, floor, fix
matlab基本函数randperm end数组索引
matlab基本函数find
【未通过】LintCode #366 斐波纳契数列
LintCode #3 统计数字
计算1至n中数字X出现的次数
LintCode #2 尾部的零
LintCode #1 A + B 问题
原文地址:https://www.cnblogs.com/lvzw/p/11558338.html
最新文章
matlab学习笔记8 基本绘图命令-LineSpec线条设定
matlab学习笔记8 基本绘图命令-特殊图形绘制
matlab学习笔记8 基本绘图命令-基本绘图操作
matlab学习笔记8 基本绘图命令-图形窗口简介
matlab学习笔记7-定时器
matlab学习笔记6--性能剖析
matlab学习笔记5--低级文件输入输出函数
二进制和ASCII文件的区别
matlab学习笔记4--导入和导出Internet数据
matlab学习笔记4--多媒体文件的保存和读取
热门文章
matlab学习笔记4--导入和导出电子数据表
matlab学习笔记4--MAT文件的保存和读取
matlab学习笔记2--matlab的帮助
matlab学习笔记1--matlab工作界面
使用Commons math做数值计算
java中如何使用列表数组
用python画 pareto front
JFreechart从入门到放弃
NSGA,NSGA-II,Epsilon-MOEA,DE C语言Deb教授原版代码
[转载]Java迭代器(iterator详解以及和for循环的区别)
Copyright © 2011-2022 走看看