Pandas 常用统计方法

DataFrame对象的统计方法

DataFrame对象有一些统计方法。它们大部分都属于约简和汇总统计，用于从 Series 中提取单个值，或从 DataFrame 的行或列中提取一个 Series。比如 DataFrame.mean(axis=0,skipna=True) 方法，当数据集中存在 NA 值时，这些值会被简单跳过，除非整个切片（行或列）全是 NA。如果不想这样，则可以通过 skipna=False 来禁用此功能。

常用统计方法	说明
count	非 NA 值的数量
describe	针对 Series 或 DF 的列计算汇总统计
min , max	最小值和最大值
argmin , argmax	最小值和最大值的索引位置（整数）
idxmin , idxmax	最小值和最大值的索引值
quantile	样本分位数（0 到 1）
sum	求和
mean	均值
median	中位数
mad	根据均值计算平均绝对离差
var	方差
std	标准差
skew	样本值的偏度（三阶矩）
kurt	样本值的峰度（四阶矩）
cumsum	样本值的累计和
cummin , cummax	样本值的累计最大值和累计最小值
cumprod	样本值的累计积
diff	计算一阶差分（对时间序列很有用）
pct_change	计算百分数变化

可以通过dir( pd.DataFrame )查看DataFrame对象的统计方法

通过 dir ( pd.core.groupby.SeriesGroupBy )查看SeriesGroupBy对象的统计方法。

查看全文

相关阅读:
现实世界的Windows Azure：采访Definition 6首席技术官Paul Hernacki
CloudConnect回顾，以及数据的未来
 现已可用：集成了Web Deploy的Windows Azure SDK 1.4更新版
 使用Azure SDK 1.4.1中的Web Deploy
现实世界的SQL Azure：采访Zitec公司CEO，Alexandru Lapusan
Microsoft和Toyota宣布战略合作伙伴关系，联手构建基于Windows Azure的下一代远程通信系统
 Delphi 2007 的重构功能
 关于类的入门的例子(6): 类引用示例
 获取所有汉字与 Unicode 的对照表
 关于类的入门例子(4): property

原文地址：https://www.cnblogs.com/ZeroTensor/p/10398165.html