zoukankan      html  css  js  c++  java
  • Python3数据分析pandas

    pandas有两个主要数据结构:Series和DataFrame。

    Series

    Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成,即index和values两部分,可以通过索引的方式选取Series中的单个或一组值。

    pd.Series(list,index=[ ]),第二个参数是Series中数据的索引,可以省略。

    DataFrame

    DataFrame是一个表格型的数据类型,每列值类型可以不同,是最常用的pandas对象。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。

    pd.DataFrame(data,columns = [ ],index = [ ]):columns和index为指定的列、行索引,并按照顺序排列。



    例:
    In [65]: pop = {'Nevada': {2001: 2.4, 2002: 2.9},
    ....:        'Ohio': {2000: 1.5, 2001: 1.7, 2002: 3.6}}
    In [66]: df3 = pd.DataFrame(pop)
    In [67]: df3
    Out[67]: 
          Nevada  Ohio
    2000     NaN   1.5
    2001     2.4   1.7
    2002     2.9   3.6
    
  • 相关阅读:
    数据结构(2)
    python数据结构(1)
    python 中__getitem__ 和 __iter__ 的区别
    python 中的 %s,%r,__str__,__repr__
    python中的zip
    python反射,单例模式
    类python中高级用法
    python中super与成员属性
    python 类与对象解析
    【其他】BootCDN
  • 原文地址:https://www.cnblogs.com/zhukaile/p/15694715.html
Copyright © 2011-2022 走看看