pandas模块
更高级的数据分析工具
基于NumPy构建
包含Series和DataFrame两种数据结构,以及相应方法
基于NumPy构建
包含Series和DataFrame两种数据结构,以及相应方法
调用方法:
from pandas import Series, DataFrame
import pandas as pd
from pandas import Series, DataFrame
import pandas as pd
Series
又像数组又像字典:
有序
通常是同构的
元素采用NumPy中的数据类型
既以按键索引,又可以按序号索引
又像数组又像字典:
有序
通常是同构的
元素采用NumPy中的数据类型
既以按键索引,又可以按序号索引
默认创建:
![](https://img2018.cnblogs.com/blog/1494023/201904/1494023-20190408152937079-861274285.png)
以字典形式创建
![](https://img2018.cnblogs.com/blog/1494023/201904/1494023-20190408153035438-1496704651.png)
以常规形式创建
Series算术运算中按照键来对齐
NaN和数字做运算,得NaN
DataFrame
很像一个Excel表格
含有一组有序的列
列内(应该)同构,列之间可以是不同的数据类型
既有列索引,也有行索引
以二维结构保存数据(高维数据视作二维表格的叠加)
含有一组有序的列
列内(应该)同构,列之间可以是不同的数据类型
既有列索引,也有行索引
以二维结构保存数据(高维数据视作二维表格的叠加)
![](https://img2018.cnblogs.com/blog/1494023/201904/1494023-20190408154615411-1606400702.png)
改名?增加列
按列读取、、按行读取
按行、列索引
丢弃指定行、列
插入列
过滤
按索引排序