一、基础
https://zhuanlan.zhihu.com/p/76905282
1、读取
2、查看 - head
3、形状 - shape
4、查看索引 index
5、查看列的全部名称 columns
6、排序
https://blog.csdn.net/MsSpark/article/details/83154128
7、groupby
https://www.jianshu.com/p/42f1d2909bb6
字段看源码
注意: by = [] 与 排序一致
分组
注意 agg的用法
https://blog.csdn.net/qq_16234613/article/details/78245325
解释:
agg方法将一个函数使用在一个数列上,然后返回一个标量的值。agg每次传入的是一列数据标量。
1)、可以同时应用多个函数,将函数放入到一个列表中,内置函数需要用引号,引起来
相同列
df['Voltage'].agg(["max", "min"])
2)、不同列
待续
作用:返回唯一值得个数
df[''].nunique()
作用:分组后,按照数量排序
df[''].value_counts()
聚合
函数名 说明
count 分组中非NA的数量
sum 非NA值的和
mean 非NA值的平均值
median 非NA值的中位数
std、var 标准差、方差
min、max 非NA值中的最小值、最大值