zoukankan      html  css  js  c++  java
  • 关于SQL和python数据预处理

    关于SQL需要掌握:

      1、提取特定情况下的数据,比如提取2017年的数据,提取前100个顾客的数据等

      2、数据库的增、删、查、改,这些命令都很简单,记住即可

      3、数据的分组聚合、如何建立多个表之间的联系,这在处理多维度、多个数据集时很有用

    对于以上,需要掌握一些基本的操作,找一些数据集练习一下即可

    ****************************************************************************

    关于python进行数据预处理,对于数据预处理,学会 pandas (Python包)的用法,应对一般的数据清洗就完全没问题了。需要掌握的知识点如下:

    • 选择:数据访问(标签、特定值、布尔索引等)

    • 缺失值处理:对缺失数据行进行删除或填充

    • 重复值处理:重复值的判断与删除

    • 异常值处理:清除不必要的空格和极端、异常数据

    • 相关操作:描述性统计、Apply、直方图等

    • 合并:符合各种逻辑关系的合并操作

    • 分组:数据划分、分别执行函数、数据重组

    • Reshaping:快速生成数据透视表

    invictus maneo!
  • 相关阅读:
    前端规范标准(一)
    node之旅(3) Express之我的第一个应用
    node之旅(2) hello wrold!
    node之旅(1) 安装NodeJS
    CSS3 基础知识
    博客转移公告
    博客主题更换留念
    网络流-费用流zkw算法
    网络流-最大流ISAP
    字符串总结-三大“自动机”
  • 原文地址:https://www.cnblogs.com/rayshaw/p/8531342.html
Copyright © 2011-2022 走看看