zoukankan      html  css  js  c++  java
  • pandas常用方法总结

    In [49]: frame2
    Out[49]: 
           year   state  pop debt
    one    2000    Ohio  1.5  NaN
    two    2001    Ohio  1.7  NaN
    three  2002    Ohio  3.6  NaN
    four   2001  Nevada  2.4  NaN
    five   2002  Nevada  2.9  NaN
    six    2003  Nevada  3.2  NaN
    取一列的值可以frame2.state或者frame2['state']
    frame2['debt'] = 16.5
    可以填充一列

    删除列用del
    del frame2['debt']
    In [73]: frame3
    Out[73]: 
    state  Nevada  Ohio
    year
    2000      NaN   1.5
    2001      2.4   1.7
    2002      2.9   3.6
    使用frame3.values可以得到一个二维ndarray
    Out[74]: 
    array([[ nan,  1.5],
           [ 2.4,  1.7],
           [ 2.9,  3.6]])
    索引对象是不可变的,不可以通过赋值修改
    可以判断某值是否在索引里
    'Ohio' in frame3.columns
    Out[87]: True
    2003 in frame3.index
    Out[88]: False

    重新索引

     

     这玩意说白了可以取已有的索引名和增加索引名,而且这玩意在

    取值多层索引的表有奇效

     这种表想取到两种性别下得1910,1960,2010的数据,可以这样

    删除列用del 那么删除行和列都可以用drop()

     

     

    索引、选取和过滤

     

     选取行以及通过布尔选数据

    用loc和iloc进行选取

    loc是根据索引取值

     iloc是根据索引编号取值

     这两个标签可以用于切片

     生成矩阵的常用方法

    np.arange(20.).reshape((4, 5)

     

     

     使用元素级的函数处理数据

     如果是Series的则使用map就行了

     

    排序和排名

     

     

    下面的这个机器学习用到过

    汇总和计算描述统计

     

     

     

    这个函数之后用于统计某一种营养含量最高的食物。

     

     

    唯一值、值计数以及成员资格

     

     这个用于查找是否包含某些名字

     

    暂时没有用到

     

    暂时没有用到

     

     
  • 相关阅读:
    python join()阻塞的用法
    python远程批量执行命令
    python多进程,以及进程池并发
    python生产者消费者模型
    python如何保证多个线程同时修改共享对象时不出错!
    python多线程,多进程
    python paramiko模拟ssh登录,实现sftp上传或者下载文件
    python初识1
    验证码的作用和实现原理
    网络应用软件结构-----CS与BS结构(网络基本知识小结)
  • 原文地址:https://www.cnblogs.com/mypath/p/12162787.html
Copyright © 2011-2022 走看看