zoukankan      html  css  js  c++  java
  • pandas分页读取excel

    一、环境配置

    主要使用的包如下:

    Package         Version
    --------------- ---------
    ...
    pandas          0.23.4
    xlrd            1.2.0
    ...

    pandas的版本比较重要,因为我们主要使用的是pandas中的read_excel函数中的nrow和skiprows参数,有的版本没有nrows参数。

    二、实现过程

    import pandas as pd
    
    path = './1.xlsx'
    
    def readrow(total_rows,df_columns):
        rows = total_rows  #总的行数
        fields_list = df_columns #获取所有的列名
        page_rows = 2  #设置每次读取的行数
        skiprows = 0
        while True:
            if skiprows >= rows:
                break
            df = pd.read_excel(path,nrows=page_rows,skiprows=skiprows)
            df.columns = fields_list  #每次读取重新赋列名
            skiprows += page_rows
            dict_list = df.to_dict(orient="records")
            print('df',df)
            print('dict_list',dict_list) #转成列表套字典的形式,方便存储在数据库中
    
    
    def excel_to_df():
        df = pd.read_excel(path)
        total_rows = df.shape[0]  #获取所有的excel中数据的行数
        df_columns = df.columns.values.tolist() #获取execl中的列名列表
        readrow(total_rows,df_columns)
    
    
    if __name__ == '__main__':
        excel_to_df()
  • 相关阅读:
    发布时间 sql语句
    Excel中 查找重复数据
    身份证正则表达式
    (转)C#中的委托与事件
    C#中的ForEach
    Ajax请求中,contentType和dataType的区别
    让IIS支持PUT和Delete请求的方法
    Vue.js事件修饰符
    JS阻止默认行为
    关于bindinglist的一点小问题
  • 原文地址:https://www.cnblogs.com/shenjianping/p/12732841.html
Copyright © 2011-2022 走看看