zoukankan      html  css  js  c++  java
  • 数据分析

    numpy:

      切片 arr[index,col]

      变形 reshape()

      级联 concatnate()

      切分

      排序

    Series:

      过滤空值

      去重 unique()

    DataFrame:

      创建

      索引:

        取列

        取行

        取元素

      切片:

        切列 df.loc[:,col]

        切行 df[]

      空值检测和过滤:

        空值检测函数:

          isnull.any(axis)

          notnull.all(axis)

        空值过滤思路:

        空值过滤函数 dropna(axis=0)

        检测重复行 drop_duplicated(keep)

        覆盖空值 fillna(method.axis)

        过滤重复行:

        随机取样:

          take([3,1,2,0],axis=1)

          random.permutaion(5)

        级联机制:

        合并机制:

        替换: replace(to_replace,value)

        映射: map() 充当运算工具:s.map(func) apply()

        分组: df.groupby(by)['xxx'].mean()

        分组聚合:

        df.groupby(by)['xxx'].apply(func)

        条件查询函数 df.query('')    

  • 相关阅读:
    2017年3月笔记
    2017年2月笔记
    2017年1月笔记
    2016年12月笔记
    2016年11月笔记
    2016年10月笔
    2016年9月笔记
    2016年8月笔记
    2016年7月笔记
    2016年6月笔记
  • 原文地址:https://www.cnblogs.com/liuqingyang/p/10510888.html
Copyright © 2011-2022 走看看