zoukankan
html css js c++ java
3.1EDA和数据描述: 探索性数据分析
EDA即数据探索,是对数据的初步分析。
包括:
每个候选预测变量 的统计特性和分布
候选预测变量和状态变量之间,以及预测变量相互间是否存在相关性
检测缺失值和极端值,评估其对结果模型的冲击
调查候选变量中的分布情况,如正常和违约的分布情况
实践中,以上步骤即:
对每个变量的单变量描述性统计
评估每个变量值的分布并检验正态假设
极端值的识别和处理
缺失值的计算和处理
关键变量的列联表以及这些表格中统计量的计算
变量间关联性指标的计算
查看全文
相关阅读:
十天冲刺4
单词统计
十天冲刺3
学习进度第十周
十天冲刺2
十天冲刺1
梦断代码阅读笔记03
学习进度第九周
[强网杯 2019]Upload
[2020 新春红包题]1
原文地址:https://www.cnblogs.com/jane-lau/p/8458332.html
最新文章
[转][PowerShell]ps执行重启IIS
[转]SuperSocket
可以通过dict[key]获得dict[value]
将登录代码模块化,然后用add address接口来调用它,success!
mac下安装好jdk和jmeter后设置环境变量
python3连接mysql
mac下安装mysql
mac下用crontab实现pytho3脚本自动定期执行,包括scrapy的定期执行
python3中整数和小数的转换
python3 发邮件 smtplib & email 库
热门文章
Oracle-监控AUD$记录
MySQL-安装数据库(Linux)
MySQL-创建示例数据库(sakila)
MySQL-执行计划中key_len计算规则
MySQL-数据库文件
MySQL-配置密码策略(validate_password)插件
Oracle 19C RAC 添加/删除节点
RHEL7安装达梦数据库
用RPM包安装postgresql
十天冲刺5
Copyright © 2011-2022 走看看