一个ndarray是一个多维同类数据容器。每一个数组有一个dtype属性,用来描述数组的数据类型。
Series是一种一维数组型对象,包含了一个值序列,并且包含了数据标签----索引(index)。
DataFrame每一列可以是不同类型,即有行索引,又有列索引,可以被是为一个共享相同索引的Series字典。尽管DataFrame是二维的,但可以利用分层索引在DataFrame中展现更高维度的数据。
一、Series、DataFrame---->narray
1)pd.values
In [134]: arr1 Out[134]: a b c a1 100 1 1 b2 10 2 2 In [135]: arr1.values Out[135]: array([[100, 1, 1], [ 10, 2, 2]])
2)np.array(pd)
In [140]: np.array(arr1) Out[140]: array([[100, 1, 1], [ 10, 2, 2]])
3)pd.as_matrix()
In [138]: arr1.as_matrix() /usr/local/bin/ipython:1: FutureWarning: Method .as_matrix will be removed in a future version. Use .values instead. #!/usr/bin/python3 Out[138]: array([[100, 1, 1], [ 10, 2, 2]])
第三种方式会被remove就用第一二种吧
二、narray---->Series、DataFrame
In [161]: arr3 Out[161]: array([0, 1, 2, 3]) In [162]: pd.Series(arr3,index=['a','b','c','d']) Out[162]: a 0 b 1 c 2 d 3 dtype: int64 In [163]: pd.DataFrame(arr3,index=['a','b','c','d']) Out[163]: 0 a 0 b 1 c 2 d 3