zoukankan      html  css  js  c++  java
  • python数据探索与数据与清洗概述

    数据探索的核心:

    1、数据质量分析(跟数据清洗密切联系,缺失值、异常值等)

    2、数据特征分析(分布、对比、周期性、相关性、常见统计量等)

    数据清洗的步骤:

    1、缺失值处理(通过describe与len直接发现、通过0数据发现)

    2、异常值处理(通过散点图发现)

    一般遇到缺失值,处理方式为(删除、插补、不处理)

    插补 

    遇到异常值,一般处理方式为视为缺失值、删除、修补(平均数、中位数等)、不处理。

  • 相关阅读:
    Python格式化字符 %s %d %f
    FTP学习笔记
    万维网
    TCP笔记
    TCP流量控制
    笔记传输层
    传输层协议
    网络层
    以太网笔记
    计算机网络物理层
  • 原文地址:https://www.cnblogs.com/gaojr/p/12092088.html
Copyright © 2011-2022 走看看