zoukankan      html  css  js  c++  java
  • pandas之DataFrame创建、索引、切片等基础操作

    知识点

    Series只有行索引,而DataFrame对象既有行索引,也有列索引
    行索引,表明不同行,横向索引,叫index,0轴,axis=0
    列索引,表明不同列,纵向索引,叫columns,1轴,axis=1

    1、DataFrame创建,可以通过index和columns指定索引名称

    #方式一
    a = pd.DataFrame(np.arange(10).reshape(2,5)) print(a)
    #方式二 a
    = pd.DataFrame(np.arange(10).reshape(2,5),index=list("ab"),columns=list("qwxyz")) print(a) #方式三 temp_dict = {"name":["yangwj","ywj"],"age":[28,29],"tel":["10080","10010"]} a = pd.DataFrame(temp_dict) print(a)

    2、DataFrame基础属性和整体情况查询

    a)基础属性
        df.shape  #行数、列数
        df.dtype #列数据类型
        df.ndim #数据维度
        df.index #行索引
        df.columns #列索引
        df.values #对象值,二维ndarray数组
    
    b)整体情况查询
        df.head(3) #显示头部几行,默认5行
        df.tail(3) #显示末尾几行,默认5行
        df.info() #相关信息概览:行数、列数、索引、列非空值个数、列类型、内存占用
        df.describe() #快速综合统计结果: 计数、均值、标准差、最大值、四分位数、最小值等

    3、通过pd.sort_values(by="Count_AnimalName",ascending=False).head(5)排序获取次数最高的排名数据

    g = pd.read_csv("./youtube_video_data/dogNames2.csv")
    print(g.describe())
    print("*"*20)
    print(g.info())
    print(g.sort_values(by="Count_AnimalName",ascending=False).head(5))

    4、切片与索引a)常规获取

      # 方括号写数组,表示取行,对行进行操作
      # 写字符串,表示取列索引,对列进行操作
      print(a[:3]) #取前3行
      print(a["Row_Labels"])#取列
    
    b)通过loc和iloc获取   #df.loc 通过标签索引行或列数据   #df.iloc通过位置获取行数据 iloc --> index location   a = pd.DataFrame(np.arange(12).reshape(3,4),index=list("abc"),columns=list("wxyz"))   print(a)   print(a.loc["a",:]) #取一行   print(a.loc[["a","c"],:])#取多行   print(a.loc[:,["x","y"]])#取多列   print(a.iloc[1,:])#取行   print(a.iloc[:,1])#取列   print(a.iloc[[1,2],[2,3]])#取多行多列

    c)布尔索引获取,可以通过&或者|做多条件布尔获取
      
    g = g[g["Count_AnimalName"]>800]
      print(g)
      print(g[(g["Count_AnimalName"]>800) & (g["Count_AnimalName"]<1000) ])
      #通过字符串长度进行选取
      print(g[(g["Row_Labels"].str.len()>4) & (g["Count_AnimalName"]<1000) ])

     5、pandas之字符串方法

  • 相关阅读:
    Mac下Selenium无法最大化Chrome解决方案
    Mac环境配置好ant后提示Permission denied
    禁止Chrome浏览器自动升级
    Selenium滚动条window.scrollTo和window.scrollBy
    Windows和Linux如何使用Java代码实现关闭进程
    自动化测试框架Selenium工作原理
    Mac下用SSH连接远程Linux或Mac服务器
    mac显示隐藏文件
    Selenium自动化测试脚本中三种等待时间简介
    Java虚拟机之栈
  • 原文地址:https://www.cnblogs.com/ywjfx/p/10837021.html
Copyright © 2011-2022 走看看