利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作

zoukankan html css js c++ java

利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作

一、reindex() 方法：重新索引

针对 Series

重新索引指的是根据index参数重新进行排序。

如果传入的索引值在数据里不存在，则不会报错，而是添加缺失值的新行。

不想用缺失值，可以用 fill_value 参数指定填充值。

例如：

fill_value 会让所有的缺失值都填充为同一个值，如果不想这样而是用相邻的元素（左或者右）的值填充，则可以用 method 参数，可选的参数值为 ffill 和 bfill，分别为用前值填充和用后值填充：

针对 DataFrame

重新索引操作：

二、drop() 方法：丢弃数据

针对 Series

针对 DataFrame

不仅可以删除行，还可以删除列：

三、索引、选取和过滤

针对 Series

需要注意一点的是，利用索引的切片运算与普通的 Python 切片运算不同，其末端是包含的，既包含最后一个的项。比较：

赋值操作：

针对 DataFrame

DataFrame 中的 ix 操作：

四、算术运算和数据对齐

针对 Series

将2个对象相加时，具有重叠索引的索引值会相加处理；不重叠的索引则取并集，值为 NA：

针对 DataFrame

对齐操作会同时发生在行和列上，把2个对象相加会得到一个新的对象，其索引为原来2个对象的索引的并集：

和Series 对象一样，不重叠的索引会取并集，值为 NA；如果不想这样，试试使用 add() 方法进行数据填充：

五、函数应用和映射

将一个 lambda 表达式应用到每列数据里：

除了lambda 表达式还可以定义一个函数：

六、排序

针对 Series

针对 DataFrame

七、排名

八、带有重复值的轴索引

索引不强制唯一，例如一个重复索引的 Series：

安装步骤已经在首篇随笔里写过了，这里不在赘述。利用Python进行数据分析(1) 简单介绍

接下来一篇随笔内容是：利用Python进行数据分析(9) pandas基础: 汇总统计和计算，有兴趣的朋友欢迎关注本博客，也欢迎大家添加评论进行讨论。

查看全文

相关阅读:
云计算设计模式（十九）——运行重构模式
 云计算设计模式（十八）——重试模式
 云计算设计模式（十七）——基于队列的负载均衡模式
 云计算设计模式（十六）——优先级队列模式
 云计算设计模式（十五）——管道和过滤器模式
 云计算设计模式（十四）——实体化视图模式
 云计算设计模式（十三）——领导人选举模式
 云计算设计模式（十二）——索引表模式
 使用WebClient上传文件时的一些问题
 .NET研发人员面试题（一）

原文地址：https://www.cnblogs.com/sirkevin/p/5745860.html