pandas是python的一个大数据模块,pandas基本的数据结构是Dataframe和Series。pandas在处理大规模数据时,真的优势很明显。
安装pandas:pip install pandas
导入pandas:import pandas as pd
pandas有一些依赖库:
比如想要使用 pd 读取 .xls 文件,则需要使用 data=pd.read_excel(filename). 此时如果只是安装了 pandas 模块的话,会提示以下错误:
意思就是“缺少依赖库xlrd”
解决办法:pip intall xlrd
然后再:data=pd.read_excel(filename)
若想要采用“pd.to_excel()”输出到文件:
outputfile='../tmp/data_type1.xls'
r=pd.Series(range(1,5))
r.to_excel(outputfile)
意思是“缺少依赖库xlwd”
解决办法:pip install xlwt
然后再:r.to_excel(outputfile)