python中的pandas的两种基本使用
2018年05月19日 16:03:36 木子柒努力成长 阅读数:480
一、pandas简介
pandas:panel data analysis(面板数据分析),是基于numpy 构建的含有更高级数据结构和工具的数据分析包,类似于numpy ,pandas也是围绕着Series 和 DataFrame两个核心数据结构展开的。Series 和 DataFrame 分别对应于一维的数列和二维的表结构。pandas的导入方式如下:
import pandas as pd
from pandas import Series,DataFrame
1.创建对象
1.1,可以通过传递一个list对象来创建一个Series,pandas默认创建整型索引:
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
s=Series([1,2,3,4,np.nan,6])
print(s)
0 1.0
1 2.0
2 3.0
3 4.0
4 NaN
5 6.0
dtype: float64
1.2,通过传递一个能够被转换成类似序列结构的的字典对象来创建一个DataFrame:
from pandas import Series,DataFrame
data={'state':['yes','yes','yes','no','no'],
'year':[2000,2001,2002,2003,2004],
'pop':[1.5,1.7,3.6,2.4,2.9]}
s=DataFrame(data)
print(s)
pop state year
0 1.5 yes 2000
1 1.7 yes 2001
2 3.6 yes 2002
3 2.4 no 2003
4 2.9 no 2004
1.3,查看数据类型和查看数据
print(s.dtypes)
print(s.head(1))
print(s.tail(2))
pop float64
state object
year int64
dtype: object
pop state year
0 1.5 yes 2000
pop state year
3 2.4 no 2003
4 2.9 no 2004