使用pandas对数据进行保存时,可以有两种形式进行保存
一、对于数据量不是很大的文件,可以放到列表中,进行一次性存储。
二、对于大量的数据,可以考虑一边生成,一边存储,可以避免开辟大量内存空间,去往列表中存储数据。
本人才疏学浅,只懂一些表面的东西,如有错误,望请指正!
下面通过代码进行说明
1 import pandas as pd 2 3 4 class SaveCsv: 5 6 def __init__(self): 7 self.clist = [[1,2,3], [4,5,6], [7,8,9]] 8 9 def savefile(self, my_list): 10 """ 11 把文件存成csv格式的文件,header 写出列名,index写入行名称 12 :param my_list: 要存储的一条列表数据 13 :return: 14 """ 15 df = pd.DataFrame(data=[my_list]) 16 df.to_csv("./Test.csv", encoding="utf-8-sig", mode="a", header=False, index=False) 17 18 def saveAll(self): 19 """ 20 一次性存储完 21 :return: 22 """ 23 pf = pd.DataFrame(data=self.clist) 24 pf.to_csv("./Test_1.csv", encoding="utf-8-sig", header=False, index=False) 25 26 27 def main(self): 28 nameList = ["beijing", "shanghai", "guangzhou", "shenzhen", "xiongan", "zhengzhou"] 29 # start表示循环从1开始计数 30 for num, data in enumerate(nameList, start=1): 31 if num % 2 == 0: 32 self.savefile(["成功", data, num]) 33 else: 34 self.savefile(["失败", data, num]) 35 return 0 36 37 if __name__ == '__main__': 38 sc = SaveCsv() 39 sc.main() 40 sc.saveAll()
下面对代码进行简单的说明:
savefile:可以通过一边循环一边保存到同一个文件上,对于部分参数的含义可以自行百度
saveAll:是通过一次性存储,将所有数据通过列表一次存储结束