pandas是基于numpy构建的,使得以Numpy为中心的应用变得更加简单方便。
一、关于pandas的安装
安装pandas必须首先安装numpy库,然后使用pip可以直接安装 pandas, pip install pandas。
二、pandas数据结构介绍
2.1、Series
pandas的基本数据结构是Series和DataFrame。Series也就是序列,是一种类似一维数组的对象以及一组与之相关的数据标签(index)组成。数据形式为:索引在左,值在右边,如果没有指定index,默认为0到n-1。
例子:
1.使用默认index
import pandas as pd a=pd.Series([1,2,3])
结果:
0 1
1 2
2 3
2.创建带有index的Series
b=pd.Series([3,2,4],index=['a','b','c']) print(b)
结果:
a 3
b 2
c 4
dtype: int64
2.2、DataFrame
DataFrame是一个表格型数据结构,类似二维数组,相当于多个带有同样index的Series组合,每个Series带有唯一表头,用来标识不同的Series
c=pd.DataFrame([[1,2,3],[4,5,6]],columns=['a','b','c']) print(c)
a b c
0 1 2 3
1 4 5 6
三、pandas读写数据
3.1、pandas提供了一些用于将表格数据读取为DataFrame对象的函数,本人最常用的是读取exel文件,但默认的pandas不能直接读写excel,所以首先需要安装读,写(xlrd,xlwt)库才可以实现excel的读写。安装方式:pip install xlrd
pip install xlwt
excel中的数据为:
1.直接读取,第一行为列标签
rl=pd.read_excel('poss.xls') print(rl)
结果:
me head wo shi
0 1 1 2 3
1 36 4 5 6
2 6 7 8 9
2.如果没有列标签,则可以添加默认列标签
rl3=pd.read_excel('poss.xls',header=None) print(rl3)
结果:
0 1 2 3
0 me head wo shi
1 1 1 2 3
2 36 4 5 6
3 6 7 8 9
3.2、pandas写数据
pandas提供了to_csv的方式,如果没有限制,则会写出行和列的标签,如下:
dl=pd.DataFrame([[1,2,3],[4,5,6]]) wl2=dl.to_csv('po1.xls')
结果:
如果禁用行和列标签的话,如下:
dl=pd.DataFrame([[1,2,3],[4,5,6]]) wl=dl.to_csv('po.xls',index=False,header=False)
结果:
暂时就先说这些基本的吧。。。