zoukankan
html css js c++ java
项目总结-驱虫市场电商数据挖掘
Table of Contents
¶
1 驱虫市场潜力分析
1.1 数据处理
1.1.1 导包
1.1.2 读取数据
1.1.2.1 读取各个子类目交易额数据,合并
1.1.2.2 自定义读取单个xlsx文件的函数
1.1.2.3 读取所有文件到列表
1.1.3 依行索引(时间)将所有文件合并到一个数据框
1.1.4 清洗数据
1.1.4.1 查看缺失值占比
1.1.4.2 抽取月份以供后面索引
1.1.4.3 循环预测2018年11月和12月的销售金额
1.1.4.4 删除15年的数据
1.2 市场变化趋势描述
1.2.1 按照年份分组求每个子类目市场的交易额总额
1.2.2 处理中文字体
1.2.3 线图分析整体市场的趋势
1.2.4 各类目市场销售额趋势分析
1.2.5 灭鼠杀虫剂近三年的增量趋势
1.2.6 查看各类目市场每年总交易额占比
1.2.6.1 计算占比
1.2.6.2 图示
1.2.7 各类目市场年增幅
1.2.7.1 计算增幅
1.2.7.2 作图
1.3 市场集中度描述
1.3.1 读取对应数据,并且描述数据
1.3.2 生成交易指数占比列,用以描述市场份额
1.3.3 图形描述交易指数占比
1.3.4 计算HHI指标并打印
2 灭鼠杀虫剂市场机会点分析
2.1 数据准备
2.1.1 读取数据
2.1.2 缺失值处理
2.1.2.1 删除缺失值占比超过98%的特征
2.1.2.2 删除特征值完全一致的
2.1.2.3 依据逻辑删除不可能会用到的列,例如链接
2.1.2.4 药品登记号后的列缺失值占比高,市场分析意义不大,故都不需要
2.1.2.5 其他逻辑上不用的列
2.1.3 查看数据
2.2 细化分析
2.3 产品类别分布
2.4 灭鼠类别分析
2.4.1 依据价格划分
2.4.2 计算各价格区间的销售额,销售额占比,宝贝数,宝贝数占比,竞争度
2.4.3 定义绘图函数
2.4.4 0-50细分价格市场分析
2.5 细分市场的其他属性分析
2.5.1 店铺类型
2.5.2 型号
2.5.3 物理形态
2.5.4 物理形态,净含量
3 竞争分析
3.1 品类分布(占比)
3.1.1 数据准备
3.1.2 查看数据
3.1.3 类目
3.1.3.1 作图查看占比的不同
3.1.4 适用对象
3.1.4.1 作图
3.2 产品结构分析
3.2.1 拜耳
3.2.1.1 读数据
3.2.1.2 自定义分类汇总函数
3.2.1.3 定义盖帽法函数(只考虑右边的尾巴盖帽)
3.2.1.4 分别定义对两个指标盖帽的函数
3.2.1.5 定义作图函数
3.2.1.6 拜耳明星产品
3.2.1.7 拜耳问题产品/潜力款
3.2.2 安速
3.2.2.1 读数据
3.2.2.2 汇总指标
3.2.2.3 盖帽法处理
3.2.2.4 BCG图
3.2.2.5 查看具体产品
3.2.2.6 安速明星
3.2.2.7 安速奶牛
3.2.2.8 安速问题
3.2.3 科凌虫控
3.2.3.1 读数据
3.2.3.2 汇总指标
3.2.3.3 盖帽
3.2.3.4 作图
3.2.3.5 查看具体产品
3.2.3.6 科凌虫控明星
3.2.3.7 科凌虫控奶牛
3.2.3.8 科凌虫控问题
3.3 流量结构分析
3.3.1 数据准备
3.3.2 拜耳
3.3.2.1 排名前10的详细数据
3.3.3 安速
3.3.4 科凌虫控
3.4 舆情分析
3.4.1 数据准备
3.4.1.1 抽评论列
3.4.1.2 去掉非英文字符
3.4.1.3 读取构建停用词列表
3.4.1.4 组合多个列表到一个列表
3.4.1.5 计算词频
3.4.1.6 组合多个字符为长字符
3.4.1.7 绘制词云图
3.4.1.8 写出词云图
3.4.1.9 基于TF-IDF 算法的关键词抽取
详情见项目链接:
https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/电商文本挖掘.ipynb
查看全文
相关阅读:
JS元素分组统计
并发工具类
【Spring-Cloud】mall eureka微服务模块建立
【Spring-Cloud】mall父工程建立
【MySQL】创建函数和存储过程,批量插入大数据
【JAVA】http 状态
【JAVA】如何写好代码
【Docker】dockerfile,支持jdk8、 sshd、 python3.6
【Hadoop】MapperReduce WordCount 代码示例
【Hadoop】YARN 完全分布式配置
原文地址:https://www.cnblogs.com/lvzw/p/11558338.html
最新文章
Java发展史
Java职业规划
bufbomb-缓冲区溢出攻击实验
入门latex——环境搭建
远程服务器开启notebook
64位的简单pwn
leetcode 6. Z 字形变换
寻找壁纸之旅
在阿里云服务器上定时发送邮件
将一个整数分解为2的幂次的拆分数
热门文章
使用STL实现集合的交并差操作
读取文件夹内文件内容,解析,写入mongo数据库
JDK8_map_computeIfAbsent方法说明
Nacos入门学习
Typora撰写发布博客
error: RPC failed; curl 56 OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 10054
maven optional
如何单页面覆盖UI组件默认样式
idea常用快捷键
JS中forEach跳出本次循环和终止循环
Copyright © 2011-2022 走看看