zoukankan      html  css  js  c++  java
  • Pandas :Series、DataFrame 结构的数据创建

    一、pandas核心数据结构:Series

    理解:Series可以理解为一个一维的数组,只是index可以自己改动。类似于定长的有序字典,有Index和value。
    创建的方法统一为:pd.Series(data,index=)         

    1)打印的时候按照index赋值的顺序

    2)index参数默认从0开始的整数,也是Series的绝对位置,即使index被赋值之后,绝对位置不会被覆盖,index赋值必须是list类型。

    Series可以通过以下形式创建:python的dict、umpy当中的ndarray(numpy中的基本数据结构)、具体某个数值。

     代码:

    import pandas as pd
    
    # 创建一组Series数据
    print(("---------------案例1--------------"))
    # 书写格式1: 列表格式
    s1 = pd.Series([90,86,70],index=["Leo","Kate","John"])
    print(s1)
    
    # 书写格式2:字典格式
    dict={"leo":90,"kate":86,"john":70}
    
    s2 = pd.Series(dict)
    print("s2=","
    ",s2)
    
    
    print(("--------------案例2--------------"))
    s3=pd.Series([3,-5,7,4],index=list('ABCD'))
    print("s3=","
    ",s3)

    结果图:

     

    二、pandas核心数据结构:DataFrame

    理解:DataFrame是一个类似于表格的数据类型,DataFrame可以理解为一个二维数组,index有两个维度,可更改。


    DataFrame参数:

    data (方框内的数据)     :numpy ndarray、dict、 DataFrame
    index(行索引索引)        :Index or array-like
    columns (列索引)          :Index or array-like
    dtype(data的数据类型) :dtype, 默认为 None

    DataFrame统一的创建形式为pd.DataFrame(data,columns=,index=)

       其中columns为列的索引,index为行的索引。

       index或者columns如果不进行设置则默认为0开始的整数。

     代码:

    import pandas as pd
    
    print("---------案例1:--------------")
    # 创建DataFrame,列名是:'name'、'gender'、'age'
    df = pd.DataFrame([['Snow','M',22],
                       ['Tyrion','M',32],
                       ['Sansa','F',18],
                       ['Arya','F',14]], columns=['name','gender','age'])
    print(df)
    
    print("---------案例2:--------------")
    # DataFrame创建,列名是:'Country'、'Capital'、'Population'
    data=[['Belglum','Brussels',11190846],
          ['Indla','New Delhi',1303171035],
          ['Brazil','Brasilia',207847528]]
    
    # index如果不写,默认从0开始序列,下面设置了从1开始序列
    df1=pd.DataFrame(data=data,index=[1,2,3],columns=['Country','Capital','Population'])
    print(df1)

    结果图:

  • 相关阅读:
    Shell脚本最佳实践
    tmux会话断电保存自动恢复
    [JD15] 括号匹配方案
    [LeetCode 187.] 重复的DNA序列
    [LeetCode 162.] 寻找峰值
    基于 Chocolatey 打造 Windows 开发环境
    [LeetCode 71.] 简化路径 【IO】
    【栈】栈排序
    [LeetCode 829.] 连续整数求和
    [LeetCode 29.] 两数相除
  • 原文地址:https://www.cnblogs.com/wodexk/p/10314507.html
Copyright © 2011-2022 走看看