zoukankan
html css js c++ java
某保险公司参保客户分析
Table of Contents
¶
1 读取数据
2 了解数据
2.1 统计一下每一列中有多少空值
2.2 查看数据中是否有重复值
2.3 可视化数据查看数据分布
2.3.1 看一下目标变量是否平衡
2.3.2 绘制年龄分布情况
2.3.3 两类样本的年龄分布
2.3.4 学历情况
2.3.5 查看不同的学历之间是否购买保险的人数
2.3.6 不同的县级别是否购买保险的人数
2.4 数据处理
2.4.1 空值填充
2.4.2 变量编码
2.5 建模
2.5.1 尝试使用最小叶节点样本数量和最小分割样本数量进行调参
2.5.2 对数据进行PCA压缩
详情链接:
https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/保险行业案例分析.ipynb
查看全文
相关阅读:
手游产品经理初探(十)竞品分析
Openfire开发配置,Openfire源码配置,OpenFire二次开发配置
code forces 148D Bag of mice (概率DP)
Android Studio怎样更改JDK和SDK的路径?
bbb
收集了三年的最好的设计站点
C# foreach 有用方法具体解释
Java 过滤器的作用
SVD神秘值分解
《C语言编写 学生成绩管理系统》
原文地址:https://www.cnblogs.com/lvzw/p/11602234.html
最新文章
Qt5.5.0在Linux下静态编译(加上-fontconfig编译项才能显示中文) good
李嘉诚巴菲特都快90岁了,为何还要拼命工作?
MiTeC System Information Component Suite 10.9.2 D5-XE3 Full Source
栈内存不是只有2M吗?为什么不溢出?
JSONP实现跨域
jQuery.reveal弹出层
Web 前端开发环境
一个MP3播放的插件jPlayer
ASP.Net MVC View
Spring MVC
热门文章
jquery选择器
Oracle 11g oracle客户端(32位)PL/SQL develepment的安装配置
Rust这个新的语言
百度官方wormHole后门检测记录(转)
SVN和Git的一些用法总结(转)
DTD验证XML(转)
关于在 xmlSPY 出现的错误 DOCTYPE-EXternalID的名称必须既是SYSTEM 又是PUBLIC?(转)
XML DTD详解(转)
教你怎样迅速秒杀掉:99%的海量数据处理面试题
脉冲神经网络Spiking neural network
Copyright © 2011-2022 走看看