zoukankan      html  css  js  c++  java
  • 关于SQL和python数据预处理

    关于SQL需要掌握:

      1、提取特定情况下的数据,比如提取2017年的数据,提取前100个顾客的数据等

      2、数据库的增、删、查、改,这些命令都很简单,记住即可

      3、数据的分组聚合、如何建立多个表之间的联系,这在处理多维度、多个数据集时很有用

    对于以上,需要掌握一些基本的操作,找一些数据集练习一下即可

    ****************************************************************************

    关于python进行数据预处理,对于数据预处理,学会 pandas (Python包)的用法,应对一般的数据清洗就完全没问题了。需要掌握的知识点如下:

    • 选择:数据访问(标签、特定值、布尔索引等)

    • 缺失值处理:对缺失数据行进行删除或填充

    • 重复值处理:重复值的判断与删除

    • 异常值处理:清除不必要的空格和极端、异常数据

    • 相关操作:描述性统计、Apply、直方图等

    • 合并:符合各种逻辑关系的合并操作

    • 分组:数据划分、分别执行函数、数据重组

    • Reshaping:快速生成数据透视表

    invictus maneo!
  • 相关阅读:
    Network (poj1144)
    C. Hongcow Builds A Nation
    ZYB loves Xor I(hud5269)
    D. Chloe and pleasant prizes
    Game(hdu5218)
    约瑟夫环的递推方法
    Misaki's Kiss again(hdu5175)
    Exploration(hdu5222)
    B. Arpa's weak amphitheater and Mehrdad's valuable Hoses
    C. Arpa's loud Owf and Mehrdad's evil plan
  • 原文地址:https://www.cnblogs.com/rayshaw/p/8531342.html
Copyright © 2011-2022 走看看