DataFrame 是 Python 中的一种数据结构,类似 excel,是一种二维表,其单元个可以存放各种数据类型的数据。同时 DataFrame 可以设置列名 columns 和行名 index 对数据进行定位。
现以xlsx表为例:
读取参数为:
def xlsx_to_csv_pd(name): data_xls = pd.read_excel(name + ".xlsx",index_col= None,header = 0,encoding="utf-8" ) return data_xls
DataFrame 数据如下:
print(data_base.tail)
以下代码供参考:
注意,此时切下的单个字符串是 string 类型,元素则是 series类型,查找相关元素内容则是按照你的数据选取相对转换成 list 或者 dict 查找方法。
# df.loc[index, column_name],选取指定行和列的数据 df.loc[0,'Name'] # 'ZHBB01A005' df.loc[0:2, ['Name','Comments']] # 选取第0行到第2行,Name和Comments列的数据, 注意这里的行选取是包含下标的。 df.loc[[2,3],['Name','Comments']] # 选取指定的第2行和第3行,Name和Comments列的数据 df.loc[df['Name']=='ZHBB01A005','Comments'] # 选取Nmae列是ZHB01A005,Comments列的数据 df.loc[df['Name']=='ZHBB01A005',[Comments','Type']] # 选取Nmae列是ZHB01A005,Comments和Type列的数据