zoukankan      html  css  js  c++  java
  • 利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作


    一、reindex() 方法:重新索引

    针对 Series
     
    重新索引指的是根据index参数重新进行排序。
    如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行。
    不想用缺失值,可以用 fill_value 参数指定填充值。
    例如:
     
    fill_value 会让所有的缺失值都填充为同一个值,如果不想这样而是用相邻的元素(左或者右)的值填充,则可以用 method 参数,可选的参数值为 ffill 和 bfill,分别为用前值填充和用后值填充:

    针对 DataFrame
     
    重新索引操作:

    二、drop() 方法:丢弃数据
     
    针对 Series
     
     
    针对 DataFrame
     
    不仅可以删除行,还可以删除列:

    三、索引、选取和过滤
     
    针对 Series
     
     
    需要注意一点的是,利用索引的切片运算与普通的 Python 切片运算不同,其末端是包含的,既包含最后一个的项。比较:
     
    赋值操作:
     
    针对 DataFrame
     
     
    DataFrame 中的 ix 操作:

    四、算术运算和数据对齐
     
    针对 Series
     
    将2个对象相加时,具有重叠索引的索引值会相加处理;不重叠的索引则取并集,值为 NA:
     
    针对 DataFrame
     
    对齐操作会同时发生在行和列上,把2个对象相加会得到一个新的对象,其索引为原来2个对象的索引的并集:
     
    和Series 对象一样,不重叠的索引会取并集,值为 NA;如果不想这样,试试使用 add() 方法进行数据填充:
     
    五、函数应用和映射
     
    将一个 lambda 表达式应用到每列数据里:
     
    除了lambda 表达式还可以定义一个函数:
     
    六、排序
     
    针对 Series
     
    针对 DataFrame
     
    七、排名
     


    八、带有重复值的轴索引
     
    索引不强制唯一,例如一个重复索引的 Series:
     
    安装步骤已经在首篇随笔里写过了,这里不在赘述。利用Python进行数据分析(1) 简单介绍
    接下来一篇随笔内容是:利用Python进行数据分析(9) pandas基础: 汇总统计和计算,有兴趣的朋友欢迎关注本博客,也欢迎大家添加评论进行讨论。
  • 相关阅读:
    PMP-合同类型
    一、JavaScript简介
    编写一程序,从键盘输入10个实数,计算并输出算术平均数
    从键盘输入3个整数,输出其中最大数
    穷举法判断键入的数是不是素数
    2.事件每天执行
    1.mysql 启动服务提示输入密码
    二、linux 用户授权
    1.maven打包乱码
    1.下载谷歌插件
  • 原文地址:https://www.cnblogs.com/sirkevin/p/5745860.html
Copyright © 2011-2022 走看看