读取excel表格:
============================
xlsx_income = pd.read_excel(r'E:Bigdata_writer数据挖掘第5章 Python数据处理工具--Pandasdata_test02.xlsx',sheetname=0,header=None, skiprows=0,skip_footer=0,index_col=None,names=None, parse_datas=False,na_values=None,thousands=None,convert_float=True)
#参数解析:
#1.第一个参数传入的是文件的路径
#2.sheetname指的是需要读取表格中的第几个Sheet,可以传表格中Sheet名称,也可以传Sheet索引值(从0开始的索引Sheet)
#3.header指的是是否需要将数据集的第一行作为表头、默认是需要的,如果不需要设置为None即可。
#name指的是 如果原数据集中没有字段(表头)、或者是想操作的时候赋予新的表头代替旧表头,可以通过该参数在读取数据时给数据框添加具体的表头
#skiprows指的是读取数据时指定跳过的开始行数(int型参数)
#skip_footer指的是读取数据时指定跳过的末尾行数(int参数)
#index_col指的是哪些列作为数据框的行索引(标签、读取之后的第一列),其参数形式是从0开始的索引(此索引代表列序号)
#na_values指的是原始数据中哪些特殊值(这个特殊值将会被NaN替换)代表了缺失值(NaN)
#thoousands千分位符
#convert_float默认是True,False的时候是将所有的数值型字段转换成浮点型字段
========================================
读取CSV文件
csv_income = pd.read_table('E:Bigdata_writer数据挖掘第5章 Python数据处理工具--Pandassunspots.csv',sep=',',index_col=None,) print(csv_income.shape) #查看数据集的行列数 #print(csv_income) print(csv_income.dtypes)
读取txt文件: