zoukankan      html  css  js  c++  java
  • Panda的学习之路(1)——series 和 Dataframe

    一、Series panda最基本的对象

    # pandas的基础
    s=pd.Series([1,3,6,np.nan,44,1])#建立个简单的基本对象 类似一个一位数组
    print("建立个简单的基本对象 类似一个一位数组")
    print(s)
    s=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
    print("命名相关的索引")
    print(s)
    s.name="xuhan"#series的每个对象都有一个对应的索引和名称
    s.index.name="行名"#对行索引进行命名
    print("对行名和整个表的名称进行相关的命名:")
    print(s)
    # 切片操作
    print("切片操作")#按行切片
    print(s[1:3])

    执行结果

    建立个简单的基本对象 类似一个一位数组
    0     1.0
    1     3.0
    2     6.0
    3     NaN
    4    44.0
    5     1.0
    dtype: float64
    命名相关的索引
    a    1
    b    2
    c    3
    d    4
    e    5
    dtype: int64
    对行名和列名进行相关的命名:
    行名
    a    1
    b    2
    c    3
    d    4
    e    5
    Name: xuhan, dtype: int64
    切片操作
    行名
    b    2
    c    3
    Name: xuhan, dtype: int64

    二、Dataframe

    2.1创建

    # dataframe 的创建
    dates=pd.date_range('20160101',periods=6,name="定义的日期表")#pd中的时间序列 从20160101开始
    # # print(dates)
    # 第一个参数表示表内的矩阵  第二个参数是每一行的索引  第三个表示没一列的索引
    df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=['a','b','c','d'])
    print(df)
    df2=pd.DataFrame(np.arange(1,13).reshape(3,4),index=list('123'),columns=list('abcd'))
    print(df2)
    df=pd.DataFrame(np.arange(12).reshape(3,4))
    print(df)

    结果:

                       a         b         c         d
    定义的日期表                                            
    2016-01-01  0.776594 -0.166321  0.156607  0.576739
    2016-01-02 -1.649947  1.274599  0.571282 -0.605256
    2016-01-03 -1.361043  0.013429  2.148883 -0.506440
    2016-01-04  1.609952  0.498063 -0.763137  1.639300
    2016-01-05  0.182889  0.630330  1.221402 -0.942096
    2016-01-06 -0.348916  1.339488  1.477448 -1.320836
       a   b   c   d
    1  1   2   3   4
    2  5   6   7   8
    3  9  10  11  12
       0  1   2   3
    0  0  1   2   3
    1  4  5   6   7
    2  8  9  10  11

    2.2对Frame中数据的排序

    df=pd.DataFrame(np.arange(12).reshape(3,4))
    print(df)
    
    print("输出表格内的数据")
    print(df.values)#values 表示输出表内的一系列数据
    
    print("输出对列索引的倒叙排序")
    print(df.sort_index(axis=1,ascending=False))# 对列索引进行排序 就是对每一行的数据进行排序
    print("输出对行索引的倒叙排序")
    print(df.sort_index(axis=0,ascending=False))#0是对行索引进行排序
    print("对某一行的固定排序")
    print(df.sort_values(by=1,ascending=False))#按某一列进行固定的排序
    print("输出表格的相关描述")
    print(df.describe())#count数量 mean平均值 std标准差 min最小值

    结果:

       0  1   2   3
    0  0  1   2   3
    1  4  5   6   7
    2  8  9  10  11
    输出表格内的数据
    [[ 0  1  2  3]
     [ 4  5  6  7]
     [ 8  9 10 11]]
    输出对列索引的倒叙排序
        3   2  1  0
    0   3   2  1  0
    1   7   6  5  4
    2  11  10  9  8
    输出对行索引的倒叙排序
       0  1   2   3
    2  8  9  10  11
    1  4  5   6   7
    0  0  1   2   3
    对某一行的固定排序
       0  1   2   3
    2  8  9  10  11
    1  4  5   6   7
    0  0  1   2   3
    输出表格的相关描述
             0    1     2     3
    count  3.0  3.0   3.0   3.0
    mean   4.0  5.0   6.0   7.0
    std    4.0  4.0   4.0   4.0
    min    0.0  1.0   2.0   3.0
    25%    2.0  3.0   4.0   5.0
    50%    4.0  5.0   6.0   7.0
    75%    6.0  7.0   8.0   9.0
    max    8.0  9.0  10.0  11.0
  • 相关阅读:
    PHP将数组转换为xml
    PHP对象转数组
    MongoDB 基础命令 (MongoDB Shell)
    PHP操作Redis常用技巧
    JavaScript 表达式 Expression
    JavaScript 语句 Statement
    JavaScript 原子常量 Atom
    encodeURI()和encodeURIComponent() 区别
    Unicode 与 JavaScript 详解
    DOCKER 相关的一些用法
  • 原文地址:https://www.cnblogs.com/William-xh/p/9556971.html
Copyright © 2011-2022 走看看