zoukankan      html  css  js  c++  java
  • pandans处理Excel

    pandans依赖处理Excel的xlrd模块,所以需要提前安装, 安装命令: pip install xlrd;

    提前准备一个Excel文件,存在两个表单;

    读取Excel的方式:

    1:默认读取第一个表单

    import pandas as pa
    df = pa.read_excel("./1.xlsx", encoding="UTF-8", header=None, sep=" ", error_bad_lines=False) # 默认读取这个Excel的第一个表单
    data=df.head() #默认读取前5行的数据
    print("获取到所有的值: {0}".format(data))#格式化输出

    得到的是个二维矩阵:

    2:通过指定表单名的方式获取

    import pandas as pa
    df = pa.read_excel("./1.xlsx", sheet_name="student")
    data = df.head() # 默认为前5
    print(data)

    得到的也是一个二维矩阵:

    3:通过表单索引来指定要访问的表单

    import pandas as pa
    # df = pa.read_excel("./1.xlsx", sheet_name=["python", "student"]) # 通过指定多个表名
    # df = pa.read_excel("./1.xlsx", sheet_name=["python", 1]) # 表名+索引
    df = pa.read_excel("./1.xlsx", sheet_name=[0, 1]) # 全部索引
    data = df.values() # 获取所有值,不需要像head()一样,指定行数
    print(data)
    
    
     

    pandas处理Excel数据为字典

    # 处理Excel为字典
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    test_data = []
    for i in df.index.values: # 获取行号的索引,并对其进行遍历、
    # 根据i来获取每一行指定的数据利用to_dict转成字典
    row_data = df.ix[i, [0, 1, 2, 3]].to_dict()
    test_data.append(row_data)
    print("最终获得数据: {}".format(test_data))

    pandans操作Excel的行列

    # 1:指定读取行
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    data = df.ix[0].values # 读取第一行,不会包括表头
    print(data)

    # 2:指定读取多行
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    data = df.ix[[1, 2]].values # 读取多行,行数写在一个列表中
    print(data)
    
    
    # 3:指定读取行列
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    data = df.ix[0, 2] # 读取第一行,第三列数据
    print(data)
    
    
    # 4:指定读取多行多列
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    data = df.ix[[0, 1], [1, 2]].values # 列表嵌套列表
    print(data)
    
    
    # 5:获取所有行的指定列/指定列的所有行
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    # data=df.ix[:, [1, 2]].values # 列表嵌套列表, ":" :代表所有行
    data=df.ix[[1, 2], :].values
    print(data)

    # 6:获取行号和列号并打印输出
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    print("输出所有的行号及列号:", (df.index.values, df.columns.values))
    
    
    
    
    
    
    # 7:获取指定行数的值/获取指定列的值
    df = pa.read_excel("./1.xlsx") # 默认读取第一个表单
    print(df.sample(3).values) #这个方法类似于head()方法以及df.values方法
    print(df["内容"].values) # 只能写行的标题,不用使用索引



     
     
     


  • 相关阅读:
    2、容器初探
    3、二叉树:先序,中序,后序循环遍历详解
    Hebbian Learning Rule
    论文笔记 Weakly-Supervised Spatial Context Networks
    在Caffe添加Python layer详细步骤
    论文笔记 Learning to Compare Image Patches via Convolutional Neural Networks
    Deconvolution 反卷积理解
    论文笔记 Feature Pyramid Networks for Object Detection
    Caffe2 初识
    论文笔记 Densely Connected Convolutional Networks
  • 原文地址:https://www.cnblogs.com/zhouzetian/p/11184498.html
Copyright © 2011-2022 走看看