zoukankan      html  css  js  c++  java
  • Pandas 基础操作复习

    Pandas

    Series

    # 创建Series实例
    import pandas as pd
    a = [1,2,3]
    myvar = pd.Series(a)
    print(myvar)
    0    1
    1    2
    2    3
    dtype: int64
    
    # 指定index
    b = ["Google", "Runoob", "Wiki"]
    my_Series = pd.Series(b,index=["x","y","z"])
    
    print(my_Series)
    x    Google
    y    Runoob
    z      Wiki
    dtype: object
    
    print(my_Series["y"])
    Runoob
    
    # 使用dict创建Series
    sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
    myvar = pd.Series(sites)
    print(myvar)
    1    Google
    2    Runoob
    3      Wiki
    dtype: object
    
    # 使用dict创建并且指定index和name
    sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
    myvar = pd.Series(sites, index = [1, 2], name="RUNOOB-Series-TEST" )
    print(myvar)
    1    Google
    2    Runoob
    Name: RUNOOB-Series-TEST, dtype: object
    
    # 如果指定的index比原数据要少,则创建的Series数据以index为准
    myvar = pd.Series(sites, index = [1, 2])
    print(myvar)
    1    Google
    2    Runoob
    dtype: object
    
    

    DataFrame

    构造方法:

    pandas.DataFrame( data, index, columns, dtype, copy)
    

    参数说明:

    • data:一组数据(ndarray、series, map, lists, dict 等类型)。
    • index:索引值,或者可以称为行标签。
    • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
    • dtype:数据类型。
    • copy:拷贝数据,默认为 False。

    创建DataFrame实例

    # 使用列表创建
    import pandas as pd
    data = [['Google',10],['Runoob',12],['Wiki',13]]
    df = pd.DataFrame(data, columns=["Site","age"],dtype=float)
    print(df)
    
    # 使用ndarrays创建
    data = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}
    df = pd.DataFrame(data)
    print(df)
    
    # 使用dict创建
    data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
    df = pd.DataFrame(data)
    print (df)
    # 结果
       a   b     c
    0  1   2   NaN
    1  5  10  20.0
    

    DataFrame行

    import pandas as pd
    
    data = {
      "calories": [420, 380, 390],
      "duration": [50, 40, 45]
    }
    
    # 数据载入到 DataFrame 对象
    df = pd.DataFrame(data)
    
    # 返回第一行
    print(df.loc[0])
    print(df[0:1])
    # 返回第二行
    print(df.loc[1])
    print(df[1:2])
    
    # 行切片
    print(df[:])
    
    
    

    --更新中

  • 相关阅读:
    CodeForces 733B Parade
    LeetCode 150 Evaluate Reverse Polish Notation
    LeetCode 148 Sort List
    数据库的迁移
    LeetCode 147. Insertion Sort List
    构建一个可以统计 qps 的nginx服务的Dockerfile
    各城市区号
    tkinter中menu菜单控件(十二)
    tkinter中scale拖拉改变值控件(十一)
    tkinter中spinbox递增和递减控件(十)
  • 原文地址:https://www.cnblogs.com/Jacob-yang/p/14769527.html
Copyright © 2011-2022 走看看