zoukankan
html css js c++ java
3.1EDA和数据描述: 探索性数据分析
EDA即数据探索,是对数据的初步分析。
包括:
每个候选预测变量 的统计特性和分布
候选预测变量和状态变量之间,以及预测变量相互间是否存在相关性
检测缺失值和极端值,评估其对结果模型的冲击
调查候选变量中的分布情况,如正常和违约的分布情况
实践中,以上步骤即:
对每个变量的单变量描述性统计
评估每个变量值的分布并检验正态假设
极端值的识别和处理
缺失值的计算和处理
关键变量的列联表以及这些表格中统计量的计算
变量间关联性指标的计算
查看全文
相关阅读:
洛谷 P2831 [NOIP2016]愤怒的小鸟
洛谷 P1736 创意吃鱼法
洛谷 P2347 砝码称重 + bitset简析
洛谷 P3384 [模板] 树链剖分
洛谷 P1038 [NOIP2012] 借教室
洛谷 P3959 [NOIP2017]宝藏 题解
洛谷 AT2167 Blackout 题解
洛谷 P1246 编码 题解
C#中ref关键字的用法总结
C#中的值传递与引用传递(in、out、ref)
原文地址:https://www.cnblogs.com/jane-lau/p/8458332.html
最新文章
移动web前端的一些硬技能(二)动手前必须掌握的基本常识
移动web前端的一些硬技能(一)关于移动设备
WebApi && Swagger 及Swagger配置
EF code frist 使用Linq或者Sql执行
处理Doc、Doc,Excel文件的学习总结- ExcelDataReader,DocX,Microsoft.Office.Interop.Word
求最短路径经典算法详解-迪杰斯特拉(Dijkstra)、弗洛伊德(Floyd)
WPF( MVVM)中TreeView 加载xml文档的方式及遇到的问题
.Net 托管代码和非托管代码,中间语言和执行,互操作
Arcgis 地理坐标系和投影坐标系
取石子游戏简化版
热门文章
魔术球问题
[国家集训队]跳跳棋
[ZJOI2010]基站选址
HDU 2993 MAX Average Problem
2020牛客暑期多校训练营(第五场)题解
2020牛客暑期多校训练营(第三场)题解
2020牛客暑期多校训练营(第二场)题解
2020牛客暑期多校训练营(第一场)题解
Resuscitated Hope(2020)
洛谷 P3953 [NOIP2017]逛公园
Copyright © 2011-2022 走看看