zoukankan      html  css  js  c++  java
  • DataFrame概念与创建

    一 概念
    Pandas是一个开源的Python数据分析库。Pandas把结构化数据分为了三类:
    Series,1维序列,可视作为没有column名的、只有一个column的DataFrame;
    DataFrame,同Spark SQL中的DataFrame一样,其概念来自于R语言,为多column并schema化的2维结构化数据,可视作为Series的容器(container);
    Panel,为3维的结构化数据,可视作为DataFrame的容器;
    
    二 创建DataFrame
    #  标准创建
    df2 = pd.DataFrame(np.arange(16).reshape((4,4)),index=['a','b','c','d'], columns=['one','two','three','four'])
    print "df2 =", df2
    
    # 用传入等长列表组成的字典来创建(用DataFrame自带索引) 自带列名
    data={'c':['1','2'],'a':['5','6']}
    df=pd.DataFrame(data)
    print "df =", df
    
    # 传入嵌套字典(字典的值也是字典)创建DataFrame (使用字典内嵌索引) 自带列名
    nest_dict = {'shanghai': {2015: 100, 2016: 101}, 'beijing': {2015: 102, 2016: 103}}
    df1=pd.DataFrame(nest_dict)
    print "df1 =", df1
    
    # 传入Series (带大括号,另外需加列名)
    list = ['1', '2', '3', '4']
    s= pd.Series(list, index=['a', 'b', 'c', 'd'])
    df1=pd.DataFrame({"A": s})
    print "df1 =", df1
    print df1
    
    三 
    

      

  • 相关阅读:
    repair table
    利用逻辑备份恢复部分库表
    Web框架理解
    BootStrape基础使用
    jQuery入门
    BOM操作
    DOM操作
    day12 css样式
    JavaScript基础
    day11 前端知识简单总结
  • 原文地址:https://www.cnblogs.com/chengxin1982/p/9124320.html
Copyright © 2011-2022 走看看