zoukankan      html  css  js  c++  java
  • pandas 初识(二)

    基本统计

    • pivot_table(数据透视表 ): 使用appfunc, 按不同index分类统计各特征values的值
    df.pivot_table(index="Pclass", values="Survived", aggfunc=np.mean)

    注: index: Pclass 字段对应的值进行分类

            values:str or list,分类统计的特征,为字符串(一个特征)或者数组(多个特征)

            aggfunc:统计特征的回调函数

      返回值: <class 'pandas.core.frame.DataFrame'>

    • apply(f, axis=0): 函数应用和映射, 针对的是行或者列的运算,axis = 0 or 1代表在行或者列上计算,并不是输出结果为行,列的标签对应的值
    • applymap(f) : 针对元素级的应用,Series 中的是 df['e'].map(f)
    • sort_index :
      • 根据任意轴上的索引进行排序 axis = 0 或1
      • 列中值进行排序(联合)可以通过by=['a', 'b']
    • range(method="first) : 获取各值得排名
      • ‘average’ : 默认,相等的值为一组,在组中为各值分配平均排名
      • ‘min’: 使用整个分组的最小排名
      • ‘max’ : 使用这个分组的最大排名
      • ‘first’ : 按值在数据中行出现的顺序分配排名
    • pd.value_counts(obj.values, sort=False) : 计算 series 中的元素个数
  • 相关阅读:
    底层原理
    No.1
    No.3
    No.0
    php 10进制转62进制,可用于短网址生成
    php实现斐波那契数列
    五种常见的 PHP 设计模式
    PHP利用MySQL保存session
    HTTP相关
    如何优化tomcat配置(从内存、并发、缓存4个方面)优化
  • 原文地址:https://www.cnblogs.com/spaceapp/p/10651165.html
Copyright © 2011-2022 走看看