zoukankan      html  css  js  c++  java
  • read_excel() && to_excel()

    加载函数为read_excel(),其具体参数如下

    read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None,names=None, parse_cols=None, parse_dates=False,date_parser=None,na_values=None,thousands=None, convert_float=True, has_index_names=None, converters=None,dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)

    常用参数解析:

    • io : string, path object ; excel 路径。
    • sheetname : string, int, mixed list of strings/ints, or None, default 0 返回多表使用sheetname=[0,1],若sheetname=None是返回全表 注意:int/string 返回的是dataframe,而none和list返回的是dict of dataframe
    • header : int, list of ints, default 0 指定列名行,默认0,即取第一行,数据为列名行以下的数据 若数据不含列名,则设定 header = None
    • skiprows : list-like,Rows to skip at the beginning,省略指定行数的数据
    • skip_footer : int,default 0, 省略从尾部数的int行数据
    • index_col : int, list of ints, default None指定列为索引列,也可以使用u”strings”
    • names : array-like, default None, 指定列的名字。

    (1)函数原型

    basestation ="F://pythonBook_PyPDAM/data/test.xls"
    data = pd.read_excel(basestation)
    print data

    sheetname参数:返回多表使用sheetname=[0,1],若sheetname=None是返回全表 注意:int/string 返回的是dataframe,而none和list返回的是dict of dataframe

    data_1 = pd.read_excel(basestation,sheetname=[0,1])
    print data_1
    print type(data_1)

    header参数:指定列名行,默认0,即取第一行,数据为列名行以下的数据 若数据不含列名,则设定 header = None ,注意这里还有列名的一行。

    data = pd.read_excel(basestation,header=None)
    print data

    skiprows 参数:省略指定行数的数据

    data = pd.read_excel(basestation,skiprows = [1])
    print data

    skip_footer参数:省略从尾部数的int行的数据

    data = pd.read_excel(basestation, skip_footer=3)
    print data

    index_col参数:指定列为索引列,也可以使用u”strings”

    data = pd.read_excel(basestation, index_col="NUM-3")
    print data

    names参数: 指定列的名字。

    data = pd.read_excel(basestation,names=["a","b","c","e"])
    print data

    存储函数为pd.DataFrame.to_excel(),注意,必须是DataFrame写入excel, 即Write DataFrame to an excel sheet。其具体参数如下:

    to_excel(self, excel_writer, sheet_name='Sheet1', na_rep='', float_format=None,columns=None, header=True, index=True, index_label=None,startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None,
    inf_rep='inf', verbose=True, freeze_panes=None)

    常用参数解析 

    - excel_writer :  ExcelWriter目标路径 
    - sheet_name : excel表名命名
    - na_rep : 缺失值填充 ,可以设置为字符串 
    - float_format : string, default None Format string for floating point numbers 
    - columns : 选择输出的列存入。 
    - header : 指定作为列名的行,默认0,即取第一行,数据为列名行以下的数据;若数据不含列名,则设定 header = None。
    - index : 默认为True,显示index,当index=False 则不显示行索引(名字)
    - index_label : 设置索引列的列名
    - startrow :upper left cell row to dump data frame 
    - startcol :upper left cell column to dump data frame 
    - engine : string, default None ,write engine to use - you can also set this via the options,io.excel.xlsx.writerio.excel.xls.writer, andio.excel.xlsm.writer
    - merge_cells : boolean, default True Write MultiIndex and Hierarchical Rows as merged cells. 
    - encoding: string, default None encoding of the resulting excel file. Only necessary for xlwt,other writers support unicode natively. 
    - inf_rep : string, default ‘inf’ Representation for infinity (there is no native representation for infinity in Excel) 
    - freeze_panes : tuple of integer (length 2), default None Specifies the one-based bottommost row and rightmost column that is to be frozen

    数据源:

    加载数据:
    basestation ="F://python/data/test.xls"
    basestation_end ="F://python/data/test_end.xls"
    data = pd.read_excel(basestation)

    (1)参数excel_writer,输出路径。

    data.to_excel(basestation_end)

    (2)sheet_name,将数据存储在excel的那个sheet页面。

    data.to_excel(basestation_end,sheet_name="sheet2")

    (3)na_rep,缺失值填充

    data.to_excel(basestation_end,na_rep="NULL")

    (4) colums参数: sequence, optional,Columns to write 选择输出的的列。

    data.to_excel(basestation_end,columns=["ID"])

    (5)header 参数: boolean or list of string,默认为True,可以用list命名列的名字。header = False 则不输出题头。

    data.to_excel(basestation_end,header=["a","b","c","d"])

    data.to_excel(basestation_end,header=False,columns=["ID"]) #header = False 则不输出题头

    (6)index : boolean, default True Write row names (index) 

    默认为True,显示index,当index=False 则不显示行索引(名字)。 
    index_label : string or sequence, default None 
    设置索引列的列名。

    data.to_excel(basestation_end,index=False)
    data.to_excel(basestation_end,index_label=["f"])
  • 相关阅读:
    USACO 2021 US Open
    【UR #20】跳蚤电话
    省选前的做题记录
    PE444
    杂题
    CF1190E
    gym100299E
    杂题
    2021 5 10 团队博客
    2021 5 9 团队博客
  • 原文地址:https://www.cnblogs.com/kimi765096/p/9051034.html
Copyright © 2011-2022 走看看