zoukankan
html css js c++ java
某保险公司参保客户分析
Table of Contents
¶
1 读取数据
2 了解数据
2.1 统计一下每一列中有多少空值
2.2 查看数据中是否有重复值
2.3 可视化数据查看数据分布
2.3.1 看一下目标变量是否平衡
2.3.2 绘制年龄分布情况
2.3.3 两类样本的年龄分布
2.3.4 学历情况
2.3.5 查看不同的学历之间是否购买保险的人数
2.3.6 不同的县级别是否购买保险的人数
2.4 数据处理
2.4.1 空值填充
2.4.2 变量编码
2.5 建模
2.5.1 尝试使用最小叶节点样本数量和最小分割样本数量进行调参
2.5.2 对数据进行PCA压缩
详情链接:
https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/保险行业案例分析.ipynb
查看全文
相关阅读:
-bash java: cannot execute binary file (华为鲲鹏云)
Centos7.6编译安装数据库mysql5.7.22(华为鲲鹏云服务器案例)
华为鲲鹏云服务器编译安装mysql-5.7.27 报错error: could not split insn
centos7.6安装nginx并设置开机自启
ansible常用模块实例
Nginx、tomcat日志切割
Linux系统文件系统损坏修复实例
Rest模式get,put,post,delete含义与区别(转)
从关系型数据库到非关系型数据库
SQL Server 2012 Express LocalDB 的作用
原文地址:https://www.cnblogs.com/lvzw/p/11602234.html
最新文章
UVALive4682 XOR Sum
HDU4825 Xor Sum
HDU1251 统计难题
HDU 2897 邂逅明下 ( bash 博弈变形
DU1525 Euclid's Game 博弈
HDU 1078 FatMouse and Cheese ( DP, DFS)
Java实现 lower_bound() 和 upper_bound()
HDU1074 Doing Homework
Lucene实践:全文检索的基本原理
架构师之路:文章记录已分享
热门文章
[业务监控系统]MEDIVH架构设计和接入方案
[jvm学习笔记]-类加载过程
【深入理解CLR】2:细谈值类型的装箱和拆箱
【深入理解CLR】1:CLR的执行模型
rabbitmq 和 kafka 简单的性能测试
golang rabbitmq实践 (二 实现简单的消息收发)
golang rabbitmq实践 (一 rabbitmq配置)
golang rabbitmq实践(啰嗦)
Tomcat性能调优之JVM
mysql备份脚本shell
Copyright © 2011-2022 走看看