zoukankan      html  css  js  c++  java
  • pandas之DataFrame创建、索引、切片等基础操作

    知识点

    Series只有行索引,而DataFrame对象既有行索引,也有列索引
    行索引,表明不同行,横向索引,叫index,0轴,axis=0
    列索引,表明不同列,纵向索引,叫columns,1轴,axis=1

    1、DataFrame创建,可以通过index和columns指定索引名称

    #方式一
    a = pd.DataFrame(np.arange(10).reshape(2,5)) print(a)
    #方式二 a
    = pd.DataFrame(np.arange(10).reshape(2,5),index=list("ab"),columns=list("qwxyz")) print(a) #方式三 temp_dict = {"name":["yangwj","ywj"],"age":[28,29],"tel":["10080","10010"]} a = pd.DataFrame(temp_dict) print(a)

    2、DataFrame基础属性和整体情况查询

    a)基础属性
        df.shape  #行数、列数
        df.dtype #列数据类型
        df.ndim #数据维度
        df.index #行索引
        df.columns #列索引
        df.values #对象值,二维ndarray数组
    
    b)整体情况查询
        df.head(3) #显示头部几行,默认5行
        df.tail(3) #显示末尾几行,默认5行
        df.info() #相关信息概览:行数、列数、索引、列非空值个数、列类型、内存占用
        df.describe() #快速综合统计结果: 计数、均值、标准差、最大值、四分位数、最小值等

    3、通过pd.sort_values(by="Count_AnimalName",ascending=False).head(5)排序获取次数最高的排名数据

    g = pd.read_csv("./youtube_video_data/dogNames2.csv")
    print(g.describe())
    print("*"*20)
    print(g.info())
    print(g.sort_values(by="Count_AnimalName",ascending=False).head(5))

    4、切片与索引a)常规获取

      # 方括号写数组,表示取行,对行进行操作
      # 写字符串,表示取列索引,对列进行操作
      print(a[:3]) #取前3行
      print(a["Row_Labels"])#取列
    
    b)通过loc和iloc获取   #df.loc 通过标签索引行或列数据   #df.iloc通过位置获取行数据 iloc --> index location   a = pd.DataFrame(np.arange(12).reshape(3,4),index=list("abc"),columns=list("wxyz"))   print(a)   print(a.loc["a",:]) #取一行   print(a.loc[["a","c"],:])#取多行   print(a.loc[:,["x","y"]])#取多列   print(a.iloc[1,:])#取行   print(a.iloc[:,1])#取列   print(a.iloc[[1,2],[2,3]])#取多行多列

    c)布尔索引获取,可以通过&或者|做多条件布尔获取
      
    g = g[g["Count_AnimalName"]>800]
      print(g)
      print(g[(g["Count_AnimalName"]>800) & (g["Count_AnimalName"]<1000) ])
      #通过字符串长度进行选取
      print(g[(g["Row_Labels"].str.len()>4) & (g["Count_AnimalName"]<1000) ])

     5、pandas之字符串方法

  • 相关阅读:
    还在使用golang 的map 做Json编码么?
    Golang 性能测试(2) 性能分析
    golang 性能测试 (1) 基准性能测试
    消息队列 NSQ 源码学习笔记 (五)
    消息队列 NSQ 源码学习笔记 (四)
    消息队列 NSQ 源码学习笔记 (三)
    消息队列 NSQ 源码学习笔记 (二)
    消息队列 NSQ 源码学习笔记 (一)
    你不知道的空格
    Supervisor 使用和进阶4 (Event 的使用)
  • 原文地址:https://www.cnblogs.com/ywjfx/p/10837021.html
Copyright © 2011-2022 走看看