一、pandas的数据结构介绍
1. Series
1.1 Series是由一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据索引构成。仅由一组数据可产生最简单的Series。
![](https://images.cnblogs.com/OutliningIndicators/ContractedBlock.gif)
from pandas import * obj=Series([4,5,-7,6]) print obj print obj[1]
1.2Series的数组运算会保留索引与值的连接
![](https://images.cnblogs.com/OutliningIndicators/ContractedBlock.gif)
from pandas import * obj2=Series([4,7,-5,3],index=['d','b','a','c']) print obj2 print obj2[obj2>0] print obj2*2
1.3如果数据存放在一个字典中,可以根据这个字典来创建Series,Series中的索引就是原字典的键
字典是Python语言中唯一的映射类型。
映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的哈希表。
字典对象是可变的,它是一个容器类型,能存储任意个数的Python对象,其中也可包括其他容器类型。
adict = {key1:value2, key2:value2, …}
字典特点:
1)、键与值用冒号“:”分开;
2)、项与项用逗号“,”分开;
3)、字典中的键必须是唯一的,而值可以不唯一。
![](https://images.cnblogs.com/OutliningIndicators/ContractedBlock.gif)
from pandas import * sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000} obj3=Series(sdata) print obj3 obj4=Series(sdata,index=['california','ohio','oregon','texas']) print obj4
1.4 Series最重要的功能是在算术运算中会自动对齐不同的索引数据
![](https://images.cnblogs.com/OutliningIndicators/ContractedBlock.gif)
from pandas import * sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000} obj3=Series(sdata) print obj3 obj4=Series(sdata,index=['california','ohio','oregon','texas']) print obj4 print obj3+obj4