#数据读取
# read_table,read_csv,read_excel
1 #读取普通分隔数据:read_table 2 #可以读取txt,csv 3 import os 4 import pandas as pd 5 os.chdir(r'C:UsersBRIGHT-SH-002Desktoppython') 6 7 8 data1 = pd.read_table('data1.csv',delimiter=',',header=0) 9 print(data1) 10 data1 = pd.read_table('data1.csv',delimiter=',',header=0,index_col=0) 11 print(data1) 12 #delimiter:用于拆分的字符,也可以用sep:sep=',' 13 #header:用做列名的序号,默认为0(第一行) 14 #index_col:指定将某烈为行索引,否则自动索引0,1 (作为索引列) 15 16 #read_table主要用于读取简单的数据 txt/csv
结果:
va1 va2 va3 va4
0 1 2 3 4
1 2 3 4 5
2 3 4 5 6
3 4 5 6 7
va2 va3 va4
va1
1 2 3 4
2 3 4 5
3 4 5 6
4 5 6 7
1 # 读取csv数据:read_csv 2 # 先熟悉一下excel怎么导出csv 3 data2 = pd.read_csv('data2.csv',engine='python') 4 print(data2.head()) 5 #engine:使用的分析引擎,可以选择C或者python。 C引擎快但是python引擎更加完备 6 #encoding:指定字符集类型,即编码,通常指定'utf-8' 7 print(type(data2)) 8 #大多数情况先将excel导出csv,再读取
#读取excel数据:read_excel data3 = pd.read_excel('test.xlsx',sheet_name='test1',header=0) print(data3.head()) #io:文件路径 #sheet_name:返回多个表用sheet_name=[0,1],若sheet_name=None是返回全表 #-> 1.int/string 返回的是dataframe 2.而None和list返回的是dict #header:指定列名行,默认0,取第一行 #index_col:指定列为索引列,也可以使用:'strings'