一、从文本文件中获取运营数据
1.使用read、readline、readlines读取数据
file_object = open('text.txt')#获取文件对象 print(fn.tell())#输出指针位置
fn = open("C:/Users/***/Desktop/Python数据分析与数据化运营/chapter2/text.txt") print(fn.tell()) line1 = fn.readline() print(line1) print(fn.tell()) line2 = fn.readline() print(line2) print(fn.tell()) fn.close()
方法 | 描述 |
read | 读取文件中的全部数据,直到到达定义的size字节数上限 |
readline | 读取文件中的一行数据,直到到达定义的size字节数上限 |
readlines | 读取文件中的全部数据,直到到达定义的size字节数上限 |
2、使用numpy的loadtxt、load、fromfile读取数据
方法 | 描述 |
loadtxt | 从txt文件中读取数据 |
load | 读取numpy专用的二进制数据文件,从npy、npz或pickled文件加载数组或pickled对象 |
fromfile | 读取简单的文本文件数据以及二进制 |
(1)使用loadtxt方法读取数据文件
numpy可以读取txt格式的数据文件,数据通常是一维或者二维的。
import numpy as np file_name = '' data = np.loadtxt(file_name,dtype='float32',delimiter=' ')
#dtype数据类型,选填 delimiter用来分割多个列的分隔符 print(data)
(2)使用load方法读取数据文件
import numpy as np write_data = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])#定义要存储的数据 np.save('load_data',write_data)#保存为npy数据文件 read_data = np.load('load_data.npy')#读取npy文件 print(read_data)#输出要读取的数据
(3)使用fromfill方法读取数据文件
import numpy as np file_name = 'C:/Users/吕秋玉/Desktop/Python数据分析与数据化运营/chapter2/numpy_data.txt' data = np.loadtxt(file_name,dtype='float32',delimiter=' ') #dtype数据类型,选填 delimiter用来分割多个列的分隔符 tofile_name = 'binary' data.tofile(tofile_name) fromfile_data = np.fromfile(tofile_name,dtype='float32') print(fromfile_data)
3、使用Pandas的read_csv、read_fwf、read_table读取数据
方法 | 描述 |
read_cvs | 读取csv文件 |
read_fwf | 读取表格或固定宽度格式的文本行到数据框 |
read_table |
读取通用分隔符分隔的数据文件到数据框 |
(1)read_csv
import pandas as pd f=open('C:/Users/吕秋玉/Desktop/Python数据分析与数据化运营/chapter2/csv_data.csv') csv_data = pd.read_csv(f,names=['col1','col2','col3','col4','col5']) print(csv_data)
(3)read_table
import pandas as pd f=open('C:/Users/吕秋玉/Desktop/Python数据分析与数据化运营/chapter2/table_data.txt')#读取csv数据 table_data = pd.read_csv(f,sep=';',names=['col1','col2','col3','col4','col5']) print(table_data)