zoukankan
html css js c++ java
项目总结-驱虫市场电商数据挖掘
Table of Contents
¶
1 驱虫市场潜力分析
1.1 数据处理
1.1.1 导包
1.1.2 读取数据
1.1.2.1 读取各个子类目交易额数据,合并
1.1.2.2 自定义读取单个xlsx文件的函数
1.1.2.3 读取所有文件到列表
1.1.3 依行索引(时间)将所有文件合并到一个数据框
1.1.4 清洗数据
1.1.4.1 查看缺失值占比
1.1.4.2 抽取月份以供后面索引
1.1.4.3 循环预测2018年11月和12月的销售金额
1.1.4.4 删除15年的数据
1.2 市场变化趋势描述
1.2.1 按照年份分组求每个子类目市场的交易额总额
1.2.2 处理中文字体
1.2.3 线图分析整体市场的趋势
1.2.4 各类目市场销售额趋势分析
1.2.5 灭鼠杀虫剂近三年的增量趋势
1.2.6 查看各类目市场每年总交易额占比
1.2.6.1 计算占比
1.2.6.2 图示
1.2.7 各类目市场年增幅
1.2.7.1 计算增幅
1.2.7.2 作图
1.3 市场集中度描述
1.3.1 读取对应数据,并且描述数据
1.3.2 生成交易指数占比列,用以描述市场份额
1.3.3 图形描述交易指数占比
1.3.4 计算HHI指标并打印
2 灭鼠杀虫剂市场机会点分析
2.1 数据准备
2.1.1 读取数据
2.1.2 缺失值处理
2.1.2.1 删除缺失值占比超过98%的特征
2.1.2.2 删除特征值完全一致的
2.1.2.3 依据逻辑删除不可能会用到的列,例如链接
2.1.2.4 药品登记号后的列缺失值占比高,市场分析意义不大,故都不需要
2.1.2.5 其他逻辑上不用的列
2.1.3 查看数据
2.2 细化分析
2.3 产品类别分布
2.4 灭鼠类别分析
2.4.1 依据价格划分
2.4.2 计算各价格区间的销售额,销售额占比,宝贝数,宝贝数占比,竞争度
2.4.3 定义绘图函数
2.4.4 0-50细分价格市场分析
2.5 细分市场的其他属性分析
2.5.1 店铺类型
2.5.2 型号
2.5.3 物理形态
2.5.4 物理形态,净含量
3 竞争分析
3.1 品类分布(占比)
3.1.1 数据准备
3.1.2 查看数据
3.1.3 类目
3.1.3.1 作图查看占比的不同
3.1.4 适用对象
3.1.4.1 作图
3.2 产品结构分析
3.2.1 拜耳
3.2.1.1 读数据
3.2.1.2 自定义分类汇总函数
3.2.1.3 定义盖帽法函数(只考虑右边的尾巴盖帽)
3.2.1.4 分别定义对两个指标盖帽的函数
3.2.1.5 定义作图函数
3.2.1.6 拜耳明星产品
3.2.1.7 拜耳问题产品/潜力款
3.2.2 安速
3.2.2.1 读数据
3.2.2.2 汇总指标
3.2.2.3 盖帽法处理
3.2.2.4 BCG图
3.2.2.5 查看具体产品
3.2.2.6 安速明星
3.2.2.7 安速奶牛
3.2.2.8 安速问题
3.2.3 科凌虫控
3.2.3.1 读数据
3.2.3.2 汇总指标
3.2.3.3 盖帽
3.2.3.4 作图
3.2.3.5 查看具体产品
3.2.3.6 科凌虫控明星
3.2.3.7 科凌虫控奶牛
3.2.3.8 科凌虫控问题
3.3 流量结构分析
3.3.1 数据准备
3.3.2 拜耳
3.3.2.1 排名前10的详细数据
3.3.3 安速
3.3.4 科凌虫控
3.4 舆情分析
3.4.1 数据准备
3.4.1.1 抽评论列
3.4.1.2 去掉非英文字符
3.4.1.3 读取构建停用词列表
3.4.1.4 组合多个列表到一个列表
3.4.1.5 计算词频
3.4.1.6 组合多个字符为长字符
3.4.1.7 绘制词云图
3.4.1.8 写出词云图
3.4.1.9 基于TF-IDF 算法的关键词抽取
详情见项目链接:
https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/电商文本挖掘.ipynb
查看全文
相关阅读:
转 windows查看端口占用命令
servlet 让浏览器输出中文,并成功打印出来.2种方法
ctrl+shift+i eclipse快捷键,debug时显示全黑屏
转 一台电脑安装多个tomcat
如何从windows中拷贝文件到linux (ubuntu)??
Eclipse Java注释模板设置简介,更改字体大小
sikuli 如何 清空文本框中的内容??解决方法!
servlet 中通过response下载文件
servlet乱码 解决方法 2种方法
关于JAVA路径 问题
原文地址:https://www.cnblogs.com/lvzw/p/11558338.html
最新文章
设置 debug 版本签名与生产版本一致
Android 架构师技能图谱(转载)
Android App开发技能图谱(转载)
本地搭建 Gradle 服务器,提高 Android Studio Gradle 下载速度
Android adb 命令速查表
Android 7.0 出现 ”FileUriExposedException“ 和 ”解析包出现错误“ 异常的解决办法
Android 计算文件 MD5 遇到的问题
license_terms
是否只查看安全传送的网页内容? 去掉 IE弹出窗口
jenkins 图文教程 下载 --》安装--》更改默认端口号,附自启动脚本
热门文章
Selenium WebDriver使用IE浏览器 属性设置
(org.jbehave.core.failures.BeforeOrAfterFailed: webdriver selenium错误解决。
Java 过滤特殊字符的 正则表达式
spring 2种下载方式 下载地址 download 地址
java hibernate Criteria 删除数据 delete data 2种方法
java hibernate session create
获取当前日期 java
如何设置页面自动刷新第二篇??
如何设置页面自动刷新第一篇?? servlet setHeader("refresh","2")
maven groupID 和 ArtifactID的区别与作用
Copyright © 2011-2022 走看看