zoukankan      html  css  js  c++  java
  • 3.1EDA和数据描述: 探索性数据分析

    EDA即数据探索,是对数据的初步分析。

    包括:

    • 每个候选预测变量 的统计特性和分布
    • 候选预测变量和状态变量之间,以及预测变量相互间是否存在相关性
    • 检测缺失值和极端值,评估其对结果模型的冲击
    • 调查候选变量中的分布情况,如正常和违约的分布情况

    实践中,以上步骤即:

    • 对每个变量的单变量描述性统计
    • 评估每个变量值的分布并检验正态假设
    • 极端值的识别和处理
    • 缺失值的计算和处理
    • 关键变量的列联表以及这些表格中统计量的计算
    • 变量间关联性指标的计算 
  • 相关阅读:
    十天冲刺4
    单词统计
    十天冲刺3
    学习进度第十周
    十天冲刺2
    十天冲刺1
    梦断代码阅读笔记03
    学习进度第九周
    [强网杯 2019]Upload
    [2020 新春红包题]1
  • 原文地址:https://www.cnblogs.com/jane-lau/p/8458332.html
Copyright © 2011-2022 走看看