zoukankan      html  css  js  c++  java
  • numpy中的ndarray与pandas中的series、dataframe的转换

    一个ndarray是一个多维同类数据容器。每一个数组有一个dtype属性,用来描述数组的数据类型。

    Series是一种一维数组型对象,包含了一个值序列,并且包含了数据标签----索引(index)。

    DataFrame每一列可以是不同类型,即有行索引,又有列索引,可以被是为一个共享相同索引的Series字典。尽管DataFrame是二维的,但可以利用分层索引在DataFrame中展现更高维度的数据。

    一、Series、DataFrame---->narray

    1)pd.values

    In [134]: arr1                                                                 
    Out[134]: 
          a  b  c
    a1  100  1  1
    b2   10  2  2
    
    In [135]: arr1.values                                                          
    Out[135]: 
    array([[100,   1,   1],
           [ 10,   2,   2]])

    2)np.array(pd)

    In [140]: np.array(arr1)                                                       
    Out[140]: 
    array([[100,   1,   1],
           [ 10,   2,   2]])

    3)pd.as_matrix()

    In [138]: arr1.as_matrix()                                                     
    /usr/local/bin/ipython:1: FutureWarning: Method .as_matrix will be removed in a future version. Use .values instead.
      #!/usr/bin/python3
    Out[138]: 
    array([[100,   1,   1],
           [ 10,   2,   2]])

    第三种方式会被remove就用第一二种吧

    二、narray---->Series、DataFrame

    In [161]: arr3                                                                 
    Out[161]: array([0, 1, 2, 3])
    
    In [162]: pd.Series(arr3,index=['a','b','c','d'])                              
    Out[162]: 
    a    0
    b    1
    c    2
    d    3
    dtype: int64
    
    In [163]: pd.DataFrame(arr3,index=['a','b','c','d'])                           
    Out[163]: 
       0
    a  0
    b  1
    c  2
    d  3
  • 相关阅读:
    govendor用法
    java.util.DualPivotQuickSort的实现
    windows注册表
    一道正则表达式题目
    JDK10、JDK11、JDK12新特性
    初夏清晨有所思
    Java 9新特性
    sklearn聚类评价指标
    沉浸式和全局式
    [抄]外部奖励对内在动机的侵蚀
  • 原文地址:https://www.cnblogs.com/tongtong123/p/10621184.html
Copyright © 2011-2022 走看看